Primeiros Passos em SQL para análise de dados
Quantas vezes você já se sentiu perdido sobre o rumo dos seus estudos? Desejou entrar em uma área e, ao explorar o que ela exige, ficou desanimado e sem saber por onde começar? Saiba que você não está sozinho. O avanço tecnológico, embora fascinante, muitas vezes torna as coisas mais complexas.
Quando decidi migrar para a área de dados, fiquei impressionado com a quantidade de tecnologias que precisava aprender. Inicialmente, pensei que bastava entender algo sobre banco de dados, uma linguagem de programação e ferramentas de visualização como Power BI ou Tableau.
Por isso, investi um bom tempo estudando bancos de dados relacionais e não relacionais, modelagem de dados (como a normalização de tabelas) e bibliotecas do Python. No entanto, ao analisar as vagas do mercado, percebi que ainda me faltava muito conhecimento prático e que minha estratégia de aprendizado não estava eficiente.
Foi então que avaliei as exigências mais recorrentes das vagas e notei que, em sua maioria, elas priorizam habilidades analíticas para explorar conjuntos de dados e gerar insights. Essa percepção mudou minha abordagem: comecei a desenvolver um perfil analítico, utilizando inicialmente ferramentas mais simples, como o Excel. Inclusive, alguns dos meus projetos podem ser vistos nas referências. Além disso, no caso do SQL, deixei de lado o foco em modelagem e passei a me concentrar em consultas exploratórias.
O que é a linguagem SQL?
Toda informação gerada precisa ser armazenada de forma estruturada e organizada. Pense em um guarda-roupas: sua vida será mais fácil se ele for bem planejado e organizado. O mesmo vale para dados no computador. É aqui que entra a linguagem SQL, que permite definir, manipular e recuperar dados de um banco de dados.
Para estruturar um banco de dados, geralmente seguimos estas etapas:
- Criação do modelo conceitual;
- Mapeamento do modelo para tabelas;
- Transformação em uma estrutura de armazenamento.
Além disso, é necessário um programa chamado SGBD (Sistema de Gerenciamento de Banco de Dados) para usar a SQL. Você pode optar por ferramentas online, como o Data World, ou instalar um aplicativo no computador, como o MySQL. Recomendo o MySQL para iniciantes por ser um dos SGBDs mais utilizados no momento (confira o ranking no site DB-Engines).
Os bancos de dados relacionais possuem uma estrutura chamada schema, que funciona como o plano de um edifício, definindo como os dados serão organizados e relacionados. O schema contém as tabelas, que são compostas por linhas e colunas onde os dados são armazenados.
Essa foi uma explicação rápida. Em outros artigos, abordarei com mais detalhes tópicos como a história dos bancos de dados, bancos não relacionais e suas diferenças. Por enquanto, isso já é suficiente para começarmos.
Como realizar consultas, filtros, ordenações e operações?
Sabendo que um banco de dados funciona como uma tabela, semelhante ao Excel, podemos usar consultas para visualizar os dados. O comando principal para isso é o SELECT, que segue esta estrutura:
SELECT [nome_da_coluna1]
FROM [nome_da_tabela];
- SELECT: comando de consulta;
- [nome_da_coluna]: as colunas que deseja exibir (ou use para selecionar todas);
- FROM: origem dos dados;
- [nome_da_tabela]: a tabela onde a consulta será feita.
Podemos adicionar elementos opcionais para refinar os resultados, por exemplo:
SELECT nome_aluno, idade_aluno
FROM tb_turmas
WHERE idade_aluno > 18
ORDER BY idade_aluno
LIMIT 10;
- WHERE = Filtra os resultados com condições específicas.
- ORDER BY = Organiza os resultados em ordem ascendente ou descendente.
- LIMIT Limita o número de linhas retornadas.
Os operadores utilizados em SQL variam dependendo do SGBD. Recomendo consultar documentação específica conforme necessário.
Como Colocar Este Conteúdo em Prática?
Agora que você entendeu os conceitos básicos de SQL e viu exemplos de consultas, é hora de praticar! Siga estas etapas para consolidar seu aprendizado:
- Configure o Ambiente
- Instale um SGBD no seu computador, como o MySQL, ou use uma ferramenta online gratuita, como o Data World.
- Crie um Banco de Dados Simples ou Baixe um dataset público ou crie uma estrutura básica para começar. Por exemplo, você pode criar uma tabela de exemplo para armazenar informações fictícias sobre alunos:
CREATE TABLE tb_turmas (
id_aluno INT,
nome_aluno VARCHAR(50),
idade_aluno INT,
frequencia_aluno DECIMAL(5, 2),
media_aluno DECIMAL(5, 2) );
INSERT INTO tb_turmas (nome_aluno, idade_aluno, frequencia_aluno, media_aluno) VALUES
('Ana', 20, 95.5, 8.7),
('João', 22, 85.3, 7.4),
('Maria', 18, 98.2, 9.1),
('Carlos', 21, 78.5, 6.8);
- Execute os Comandos Aprendidos - Realize consultas simples usando o comando SELECT. Experimente aplicar filtros com WHERE, ordenar resultados com ORDER BY e limitar a quantidade de registros exibidos com LIMIT. Por exemplo:
SELECT nome_aluno, media_aluno FROM tb_turmas
WHERE media_aluno >= 8
ORDER BY media_aluno DESC
LIMIT 2;
- Refine Sua Prática - Teste diferentes condições de filtragem. Altere os valores da tabela para observar como isso impacta os resultados. Crie tabelas adicionais para simular um cenário mais complexo, como informações de turmas, professores ou disciplinas.
Espero que este conteúdo tenha sido útil para você. No próximo artigo, falarei sobre categorização, codificação e binarização de variáveis com SQL. Ficou com dúvidas ou gostou do conteúdo? Deixe um comentário!
Até o próximo artigo.
Referência do artigo:
Introdução à Linguagem SQL: Abordagem Prática Para Iniciantes | Amazon.com.br - é um livro bem didático pois trata das consultas que podemos realizar com a linguagem, e acaba sendo mais simples para aprender.
SQL Tutorial - Plataforma de pratica da linguagem. Com ela você consegue ver e práticar os códigos. É bem simples de usar.
DB-Engines Ranking - popularity ranking of database management systems - Ranking dos SGBD mais populares
MySQL :: 10 Principais Motivos para Usar o MySQL como um Banco de Dados Incorporado: artigo sobre motivações técnicas para usar o MySQL