Netflix_ETL_Python_Dashboard_Solution
# Origem - Conjunto de dados -> DIO - Digital Innovation One
https://github.com/digitalinnovationone/netflix-dataset.git
# Developer & Speaker - Mateus Fleck
https://github.com/Mateus-Fleck/Netflix_ETL_Python_Dashboard_Solution_PowerBI
Dados ficticios
## O que vamos usar (downloads de links e visão geral)
* Python = https://www.python.org/downloads/
* Pip = https://pypi.org/project/pip/
* Pandas = https://pandas.pydata.org/
# Passo a passo
# Criar ambiente virtual
1. Crie um ambiente virtual (Prompt de Terminal - CMD)
python -m venv venv
2. Ative a Máquina Virtual
venv/scripts/ativar
### Conceitos = Etapas dos dados
DATA RAW = Todos os dados antes de qualquer processo de polimento ou processamento, são os dados em sua forma mais bruta.
DATA READY - É quando os dados passaram pelo processo de refinamento.
3. Instale bibliotecas
VERSÃO DE VERIFICAÇÃO PIP
pip --versão
Atualizar pip
python.exe -m pip instalar -upgrade pip
1. Instale Pandas
pip instalar pandas
2. Instale o openpyxl (abrir e ler arquivos)
pip instalar openpyxl
2. Instale o xlsxwriter (gravar arquivos)
pip instalar xlsxwriter
REGRAS: Processamento de Dados
- Esforce-se pela confiabilidade e rastreabilidade dos dados.
## ETL
- Na coluna utm_link de cada arquivo XLSX (Extraia o nome do arquivo de origem de cada cliente e crie uma coluna chamada filename.)
- Na coluna utm_link de cada arquivo XLSX, contenha o nome e o nome do país de origem. (Extraia o nome do país e crie uma nova coluna chamada localização com cada nome de país.)
- Cada arquivo XLSX contém uma coluna chamada utm_link com informações do nome da campanha de marketing. (Extraia o nome da campanha e crie uma nova coluna chamada campanha com o nome de cada campanha de marketing.)
Dashboard Solution:
- Crie uma visualização de dados com Power Bi
Link Solution:
Netflix_Dashboard_v1 https://app.powerbi.com/view?r=eyJrIjoiYTdhODdhNDUtMjczZi00NzExLThmODQtNDJkYzFhZGIxMzVmIiwidCI6ImJkNGYxOWRlLTc1MmUtNDgxMy1iYmRmLWE3MmI4ZGE2ZTI1MSJ9