O que é transformação de dados?
A transformação de dados é o processo de alterar o formato, a estrutura ou os valores dos dados. Normalmente é necessário transformar os dados em algum ponto para facilitar a análise.
A transformação de dados geralmente envolve:
· Adicionar, copiar ou replicar dados
· Excluindo campos ou registros
· Padronizando os nomes das variáveis
· Renomear, mover ou combinar colunas em um banco de dados
· Unindo um conjunto de dados com outro
· Salvando um arquivo em um formato diferente. Por exemplo, salvar uma planilha como um arquivo de valores separados por vírgula (CSV).
Por que transformar dados?
As metas para a transformação de dados podem ser:
· Organização de dados: dados melhor organizados são mais fáceis de usar
· Compatibilidade de dados: diferentes aplicativos ou sistemas podem usar os mesmos dados
· Migração de dados: dados com formatos correspondentes podem ser movidos de um sistema para outro
· Mesclagem de dados: dados com a mesma organização podem ser mesclados
· Aprimoramento de dados: os dados podem ser exibidos com campos mais detalhados
· Comparação de dados: comparações de igual para igual dos dados podem então ser feitas
Exemplo de transformação de dados: Mesclagem de dados
Maria é uma doceira dona de uma empresa de festas. Depois de anos no negócio, ela compra outra empresa de festas. Maria deseja mesclar as informações do cliente de sua empresa recém-adquirida com as suas, mas a outra empresa usa um banco de dados diferente. Então, Maria precisa tornar os dados compatíveis. Para isso, ela precisa transformar o formato dos dados da empresa adquirida. Em seguida, ela deve remover as linhas duplicadas dos clientes que eles tinham em comum. Quando os dados são compatíveis e juntos, a empresa de festas de Maria terá um banco de dados de clientes completo e mesclado.