image

Acesse bootcamps ilimitados e +650 cursos

50
%OFF
Article image
Brayan Guimarães
Brayan Guimarães10/07/2024 17:28
Compartilhe

Técnicas essenciais de visualização de análise exploratória de dados

  • #Python

Introdução

Olá, pessoal! Se você está começando no mundo da Análise Exploratória de Dados, talvez esteja se perguntando: “Qual gráfico eu devo usar para mostrar meus dados?” Não se preocupe, estou aqui para te ajudar a escolher a melhor técnica de visualização e te mostrar como fazer isso com exemplos de código! Vamos explorar juntos as técnicas e os gráficos mais comuns? 

Quais são as técnicas de visualização mais comuns usadas na Análise Exploratória de Dados?

Quando você tem muitos dados, você pode usar gráficos para entender melhor o que eles estão dizendo. É como pegar uma caixa de ferramentas e escolher a ferramenta certa para cada trabalho!

Aqui estão três técnicas básicas:

Gráfico de Barras: Ótimo para comparar categorias diferentes. Exemplo: “Qual brinquedo é mais popular?”

Gráfico de Linhas: Ideal para mostrar mudanças ao longo do tempo. Exemplo: “Como a temperatura mudou durante a semana?”

Gráfico de Dispersão: Perfeito para ver relações entre duas variáveis.

Exemplo: “Há uma relação entre horas de estudo e notas?”

Exemplos de Código:

Gráfico de Barras:

import matplotlib.pyplot as plt

brinquedos = ['Carrinho', 'Boneca', 'Quebra-Cabeça', 'Lego', 'Skate']
popularidade = [50, 35, 45, 60, 40]

plt.bar(brinquedos, popularidade, color='skyblue')
plt.title('Popularidade dos Brinquedos')
plt.xlabel('Brinquedo')
plt.ylabel('Número de Crianças')
plt.show()

Gráfico de Linhas:

dias_da_semana = ['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta', 'Sábado', 'Domingo']
temperatura = [22, 24, 26, 23, 25, 27, 28]

plt.plot(dias_da_semana, temperatura, marker='o', color='green')
plt.title('Temperatura ao Longo da Semana')
plt.xlabel('Dia da Semana')
plt.ylabel('Temperatura (°C)')
plt.show()

Gráfico de Dispersão:

horas_estudo = [1, 2, 3, 4, 5, 6]
notas = [55, 60, 65, 70, 75, 80]

plt.scatter(horas_estudo, notas, color='red', s=100)
plt.title('Horas de Estudo vs. Notas')
plt.xlabel('Horas de Estudo')
plt.ylabel('Notas')
plt.show()

Como escolher a técnica de visualização mais adequada para um conjunto de dados específico?

Para escolher o gráfico certo, pense no que você quer mostrar com seus dados. É como escolher o brinquedo certo para brincar com seus amigos!

Aqui está um guia rápido:

Comparar Categorias: Use um gráfico de barras.

Exemplo: “Qual brinquedo é mais popular?”

Código:

plt.bar(brinquedos, popularidade, color='skyblue')
plt.title('Popularidade dos Brinquedos')
plt.xlabel('Brinquedo')
plt.ylabel('Número de Crianças')
plt.show()

Mostrar Mudanças ao Longo do Tempo: Use um gráfico de linhas.

Exemplo: “Como a temperatura mudou durante a semana?”

Código:

plt.plot(dias_da_semana, temperatura, marker='o', color='green')
plt.title('Temperatura ao Longo da Semana')
plt.xlabel('Dia da Semana')
plt.ylabel('Temperatura (°C)')
plt.show()

Explorar Relações Entre Variáveis: Use um gráfico de dispersão.

Exemplo: “Há uma relação entre horas de estudo e notas?”

Código:

plt.scatter(horas_estudo, notas, color='red', s=100)
plt.title('Horas de Estudo vs. Notas')
plt.xlabel('Horas de Estudo')
plt.ylabel('Notas')
plt.show()

Quais são os principais tipos de gráficos e suas utilizações na Análise Exploratória de Dados?

Vamos dar uma olhada mais de perto em três tipos de gráficos e quando usá-los:

Gráfico de Barras:

Usado para comparar diferentes categorias.

Quando Usar: Para ver qual coisa é maior ou menor.

Exemplo de Código:

plt.bar(brinquedos, popularidade, color='skyblue')
plt.title('Popularidade dos Brinquedos')
plt.xlabel('Brinquedo')
plt.ylabel('Número de Crianças')
plt.show()

Gráfico de Linhas:

Mostra como algo muda ao longo do tempo.

Quando Usar: Para ver padrões ou tendências.

Exemplo de Código:

plt.plot(dias_da_semana, temperatura, marker='o', color='green')
plt.title('Temperatura ao Longo da Semana')
plt.xlabel('Dia da Semana')
plt.ylabel('Temperatura (°C)')
plt.show()

Gráfico de Dispersão:

Mostra como duas coisas estão relacionadas.

Quando Usar: Para ver se existe uma correlação.

Exemplo de Código:

plt.scatter(horas_estudo, notas, color='red', s=100)
plt.title('Horas de Estudo vs. Notas')
plt.xlabel('Horas de Estudo')
plt.ylabel('Notas')
plt.show()

Curtiu esse conteúdo? Ele foi gerado por inteligência artificial, mas foi revisado por alguém 100% humano.

Fontes de produção:

Ilustrações de capa: gerada pela lexica.art

Conteúdo gerado por: ChatGPT e revisões humanas

Compartilhe
Comentários (0)