ETL X ELT - Entendendo de forma simples o que são e suas diferenças.
Após o processo de criação de um banco de dados (parte estrutural), o Engenheiro de dados tem a função de “preencher” esse banco com dados.
Mas com qual objetivo?
Profissionais como os analistas e cientistas de dados precisam buscar esses dados ((já devidamente limpos e preparados) de dentro do banco de dados para gerar consultas e análises, que por sua vez transformarão em “insights” nas tomadas de decisão das empresas. 📈
O que é ETL?
ETL (significa extract, transform e load / extrair, transformar, carregar)
É o processo de EXTRAIR os dados brutos de diversas fontes (como sistemas transacionais, arquivos CSV, APIs, e etc). Depois fazer a TRANSFORMAÇÃO, que seria a limpeza desses dados (limpeza, agregação, sumarização, validação,…). E com os dados limpos e corretos, são logo em seguida CARREGADOS para o sistema de destino (como bancos Data Warehouse, Data Lake, etc) estando preparados para as análises.
O que é ELT?
ELT (significa extract, load e transform / extrair, carregar, transformar)
É um processo similar ao ETL porém a diferença é que os dados brutos extraídos das fontes, são carregados no sistema de armazenamento ANTES da TRANSFORMAÇÃO. Portanto, os dados são carregados no sistema ainda brutos para assim fazer a limpeza neles.