image

Bootcamps ilimitados + curso de inglês para sempre

80
%OFF
Article image
Regilene Silva
Regilene Silva23/05/2024 12:46
Compartilhe

Data Science Hierarchy of Needs -A pirâmide de Monica Rogati

  • #Data

Oi, pessoal! Como vocês estão? Estudando muito? Trouxe um artigo bem legal sobre as necessidades fundamentais em ciência de dados e a relação com os profissionais da área. Qualquer incoerência é culpa do ChatGPT.

image

Elaborada em 2017 por Monica Rogati, a Pirâmide Data Science Hierarchy of Needs" ilustra as necessidades fundamentais em Ciência de Dados. No entanto, a pirâmide não contém apenas camadas e etapas necessárias para alcançar valor a partir de Dados, mas também define diferentes papéis de profissionais que lidam com dados.

Construída originalmente como uma metáfora que ajuda a entender a progressão das necessidades de uma organização que deseja se tornar orientada a dados (tomar decisões baseadas em dados), a partir dela é possível observar a atividade fundamental, o profissional envolvido e os serviços que envolvem as tarefas.

1.Coleta de Dados (Collect):

  • Base da pirâmide: Foca na coleta e armazenamento dos dados. É fundamental garantir que os dados sejam coletados de maneira consistente e armazenados em um local acessível.
  • Profissionais Envolvidos: Engenheiros de Dados, Administradores de Banco de Dados.
  • Atividades: Configuração de sistemas de coleta de dados, integração de diversas fontes de dados, construção de pipelines de dados.

2. Movimentação e Armazenamento de Dados (Move/Store):

  • Inclui a transferência e o armazenamento de dados coletados em repositórios apropriados, como data lakes e data warehouses.
  • Profissionais Envolvidos: Engenheiros de Dados, Administradores de Banco de Dados.
  • Atividades: Implementação de processos ETL (Extract, Transform, Load), uso de sistemas de armazenamento escaláveis (Hadoop, S3).

3.Exploração e Transformação de Dados (Explore/Transform):

  • Envolve a preparação e transformação dos dados para torná-los utilizáveis para análises.
  • Profissionais Envolvidos: Engenheiros de Dados, Analistas de Dados.
  • Atividades: Limpeza de dados, transformação de dados brutos em formatos utilizáveis, exploração de dados para detectar padrões.

4.Agregação e Rotulagem de Dados (Aggregate/Label):

  • Inclui a agregação de dados e a rotulagem para facilitar análises mais avançadas.
  • Profissionais Envolvidos: Analistas de Dados, Engenheiros de Dados, Cientistas de Dados.
  • Atividades: Criação de datasets agregados, rotulagem de dados para treinamento de modelos de machine learning.

5.Análise e Modelagem (Analyze):

  • Foca na análise dos dados para extrair insights e na construção de modelos preditivos.
  • Profissionais Envolvidos: Cientistas de Dados, Analistas de Dados.
  • Atividades: Análise exploratória de dados (EDA), construção de modelos de machine learning, validação de modelos.

6.Otimização e Ação (Optimize/Act):

  • Topo da pirâmide: Envolve o uso de insights derivados dos dados para tomar decisões informadas e otimizar processos de negócios.
  • Profissionais Envolvidos: Cientistas de Dados, Analistas de Negócios, Executivos.
  • Atividades: Implementação de modelos preditivos em produção, tomada de decisões baseada em dados, otimização de processos de negócios.

Relação com os Papéis dos Profissionais:

  • Engenheiros de Dados: Principalmente envolvidos nas camadas de coleta, movimentação, armazenamento, exploração e transformação de dados.
  • Analistas de Dados: Trabalham na exploração, transformação, agregação, rotulagem e análise de dados.
  • Cientistas de Dados: Envolvidos na análise, modelagem, otimização e uso dos dados para tomada de decisão.
  • Administradores de Banco de Dados: Focados na infraestrutura de armazenamento e na garantia de que os dados estão disponíveis e seguros.
  • Analistas de Negócios e Executivos: Utilizam insights derivados dos dados para tomar decisões estratégicas e otimizar processos.

Conclusão:

A pirâmide de Monica Rogati oferece uma visão abrangente das etapas necessárias para transformar dados brutos em decisões informadas e ações estratégicas. Cada camada da pirâmide destaca um conjunto de atividades e competências necessárias, ilustrando claramente os papéis dos diferentes profissionais que trabalham com dados.

Este artigo foi elaborado com a ajuda do ChatGPT, resumido e revisado por humanos.

Boa semana e bons estudos a todos.

Compartilhe
Recomendados para você
Microsoft 50 Anos - Prompts Inteligentes
Microsoft 50 Anos - GitHub Copilot
Microsoft 50 Anos - Computação em Nuvem com Azure
Comentários (0)