Iniciando com Pandas
- #Data
- #Python
Pandas é uma biblioteca open source amplamente utilizada por conta dos seus diversos benefícios e características, tais como: simplicidade, rapidez e flexibilidade.
Ao contrário do que muitos pensam, O nome “Pandas” não faz referência ao mamífero, e sim advém de “Panel Data”, que traduzido para o português é “Dados em Painel”.
Essa biblioteca pode ser utilizada para análise e limpeza de dados, queries em BDs, visualização de dados, entre outros.
Outro ponto a se considerar, é que Pandas funciona muito bem quando usada em conjunto com outras bibliotecas, como Numpy e Scipy.
Primeiros passos
- Instalação
A instalação pode ser feita pelo PIP, que é o sistema de gerenciamento do Python, ou pelo Anaconda (no meu caso, achei mais simples pelo Anaconda, por já vir embutido outras bibliotecas).
** Farei um artigo específico sobre o Anaconda, para não misturar informações aqui**
- Criando uma Serie
Series em Pandas se referem a um array unidimensional, ou seja, com apenas uma coluna.
OBS: O index (índice) sempre estará presente, até mesmo em uma Serie!
Em um primeiro momento, opte por criar uma simples Serie para se familiarizar com a biblioteca através do código abaixo, que foi feito pela IDE Spyder:
Esse será o resultado no terminal:
A primeira coluna se refere ao índice, e a segunda são os valores que nós criamos.
- Criando um DataFrame
Um DataFrame se refere a um array com mais de uma dimensão, ou seja, mais de uma coluna. A sua criação pode parecer um pouco complicada vista de primeira, porém com a prática tudo se torna mais fácil:
Neste exemplo, optei por mudar os índices para exemplificar que isso também é possível, caso o usuário queira. Abaixo, está a saída dos dados:
Posteriormente, criarei conteúdo acerca de Análise de dados utilizando outras bibliotecas.
Espero que tenham gostado, deixem comentários com a opinião de vocês ou dúvidas!
Github: https://github.com/An4PDM
Linkedin: https://www.linkedin.com/in/ana-paula-santos-de-melo-3105b82b7/