Potencializando decisões no Mercado Financeiro com Ciência de Dados
William Edwards Deming. (Foto de Capa)
Olá Pessoal!
Todos bem?
Este artigo tem como objetivo trazer um insight de como a Ciência de Dados pode ser uma grande aliada para tomada de decisões no Mercado Financeiro, utilizando o Python, uma das linguagens mais utilizadas para análise de dados
Não pretendemos adentrar na parte técnica (programação) para evitar que o artigo fique muito denso, procurando focar mais nas possibilidades que a Ciência de Dados com Python traz ao Mercado Financeiro
Sem mais delongas...
#Bora
O que teremos nos próximos capítulos:
- O que a Ciência de Dados com Python pode ajudar no Mercado Financeiro?
- Fontes de Dados para Análise
- Tratamento de Dados
- Visualização de Dados
- Storytelling, o pulo do gato
- Tomada de Decisão (nem tudo é parte do Cientista)
- Conclusão
- Referências Bibliográficas
1. O que a Ciência de Dados com Python pode ajudar no Mercado Financeiro?
A área de Ciência de Dados consiste na prática de minerar grandes conjuntos de dados brutos. Com tais dados, é possível identificar padrões e extrair insights valiosos. O termo surgiu em 1960 e era usado como sinônimo de ciência da computação.
Com o advento do Big Data, a Ciência de Dados passou a ser empregada como a conhecemos atualmente. Ela é uma disciplina interdisciplinar, incorporando conhecimentos de estatística, matemática, mineração de dados e análises preditivas.
A Ciência de Dados tornou-se responsável por estruturar planos de ação altamente assertivos, embasados em uma sólida base de dados minerados, tratados e interpretados. Da mesma forma que em outras áreas, ela também é amplamente utilizada no Mercado Financeiro.
Além disso, a Ciência de Dados permite que empresas criem planos e estratégias de negócios embasados em análises informadas sobre o comportamento do cliente, tendências de mercado e concorrência. Sem ela, as empresas correm o risco de perder oportunidades e tomar decisões falhas.
Fonte [1]
2. Fontes de Dados
No que diz respeito à Ciência de Dados, o elemento mais importante não poderia deixar de ser o próprio DADO! Sem dados, não há análise, estatística ou tomada de decisão analítica!
No contexto do Python, podemos considerar os principais tipos de dados:
Estruturados: seguem diversas regras, como dados de origem de bancos de dados, por exemplo, B3, Banco Central, Corretoras, Bloomberg, entre outros.
Não estruturados: representam cerca de 80% do universo dos dados. Incluem fotos, áudios, vídeos e emojis.
Além disso, há um terceiro tipo chamado de semiestruturado, que não possui uma forma definida. Um exemplo são os arquivos XML. Isso ocorre com os dados fornecidos por sites para investidores, nos quais as informações são coletadas a partir do site e utilizadas para tomada de decisão. Exemplos incluem Twitter, Investing.com e Bloomberg.
Fonte [2]
Exemplo de Fontes de Dados Estruturados, disponíveis gratuitamente para a área de Economia
Banco Central https://www.bcb.gov.br/acessoinformacao/dadosabertos
IBGE - https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html
FGV Fundação Getúlio Vargas https://sistema.bibliotecas-bdigital.fgv.br/
FMI Fundo Monetário Internacional https://www.imf.org/en/home
Fonte [3]
3 – Tratamento de Dados
Nem tudo são flores. Um dos maiores desafios do Cientista de Dados no Mercado Financeiro, e talvez o que mais demanda tempo, são exatamente os DADOS.
Imagine extrair, tratar e filtrar dados? Sim! Os dados precisam estar em perfeitas condições para um resultado satisfatório. Quanto melhores forem os dados, melhor será o resultado.
É comum encontrarmos dados em péssimas condições no Mercado Financeiro. Por esse motivo, muitos Bancos e Corretoras pagam pelo fornecimento de dados limpos. As fontes de dados pagas geralmente possuem qualidade superior. As gratuitas, por outro lado, frequentemente possuem muitos dados faltantes, conhecidos como Missing Data.
É trabalho do Cientista de Dados organizar e limpar todos os dados, inclusive removendo valores repetidos ou trabalhando para solucionar dados ausentes.
Fonte [4]
4 – Visualização de Dados?
Estamos chegando a uma parte interessante do artigo, onde tudo começa a ganhar vida. A visualização de dados dá vida ao seu trabalho.
A mente humana é altamente receptiva à informação visual, e é por isso que a visualização de dados se torna uma ferramenta poderosa para a comunicação.
A visualização de dados pode ser utilizada para:
- Tornar os dados atraentes e fáceis de entender.
- Identificar tendências e situações atípicas dentro de um conjunto de dados.
- Contar uma história encontrada nos dados.
- Reforçar um argumento ou opinião.
- Destacar um ponto importante em um conjunto de dados.
5 – Storytelling
Deixar o Storytelling em uma subseção separada foi proposital devido à extrema importância do conteúdo.
O Storytelling é uma "arte" muito mais relacionada às habilidades interpessoais do colaborador.
Vamos imaginar a seguinte situação: um Cientista de Dados cria um modelo matemático que demonstra a evolução de uma taxa de juros, comparando-a com diversos outros países, e conclui que, com base em seu modelo, ela precisa ser reduzida. No entanto, ele não sabe como explicar como chegou a essa conclusão.
O storytelling abrange ensinar, motivar, engajar, divertir, comover e estabelecer conexões entre todos os pontos. É como contar uma história em quadrinhos.
Explicar tudo à equipe também faz parte das responsabilidades do Cientista de Dados. Caso ele não possua essa habilidade, todo o trabalho realizado por esse profissional provavelmente será prejudicado; é aí que entra o storytelling.
Fonte [6]
6 – Tomada de Decisão (nem tudo é parte do Cientista)
Este é um ponto que muitas vezes não é discutido, mas é mais do que necessário que o Cientista de Dados tenha isso em mente.
A tomada de decisão é um momento que exige o máximo de cuidado por parte dos gestores em qualquer setor ou situação dentro de uma empresa.
Em Python, podemos usar modelos matemáticos que ajudam na tomada de decisão. Nesse caso, uma alternativa é recorrer aos Cientistas de Dados!
O que muitos não sabem é que não é o Cientista de Dados que toma a decisão.
Os gestores são responsáveis por decidir se utilizarão ou não o modelo estatístico. Como Cientista de Dados, analisamos apenas os dados.
Por exemplo, em uma gestora de fundos, em uma corretora ou em um banco, o Cientista de Dados está lá para AUXILIAR na tomada de decisão.
Fonte [7]
7 – Conclusão
A partir do artigo, podemos concluir que a Ciência de Dados é uma ferramenta poderosa para o Mercado Financeiro, dadas todas as possibilidades disponíveis.
Observamos a popularidade do Python como linguagem de programação e a ampla disponibilidade de bibliotecas, o que reforça seu uso.
Percebemos a importância dos dados e a quantidade de fontes que os disponibilizam, até mesmo gratuitamente.
Reforçamos a necessidade de os dados estarem bem organizados, filtrados e livres de falhas.
Vimos como os dados podem ser transformados em gráficos, ganhando vida.
Compreendemos a importância do storytelling como uma excelente forma de apresentação do conteúdo criado pelo Cientista de Dados.
E, por fim, destacamos que a tomada de decisão não é responsabilidade do Cientista de Dados em relação aos resultados obtidos. O papel do Cientista de Dados é criar um modelo imparcial, sendo o gestor aquele que tomará a decisão.
Vale lembrar de um nome muito importante na área de Dados: William Edwards Deming. Ele é amplamente reconhecido por sua contribuição para a melhoria dos processos produtivos nos Estados Unidos durante a Segunda Guerra Mundial, além de seu trabalho no Japão. A partir de 1950, ele ensinou altos executivos a aprimorar o design, qualidade do produto, testes e vendas (especialmente nos mercados globais), utilizando métodos estatísticos, como análise de variância e testes de hipóteses.
Fonte [8]
Agradeço ao Ifood e à Dio pela oportunidade que estão proporcionando a milhares de brasileiros, que podem dar um impulso inicial para uma carreira promissora!
8 – Referências
[1] https://awari.com.br/tudo-sobre-ciencia-de-dados
[2] https://www.crawly.com.br/blog/dados-nao-estruturados-o-que-sao-e-como-coleta-los
[3] http://www.fea.usp.br/biblioteca/fontes-de-informacao/fontes-de-acesso-aberto
[4] https://www.mygreatlearning.com/blog/data-cleaning-in-python/
[5] https://pt.venngage.com/blog/visualizacao-de-dados/
[6] https://www.palavrabordada.com.br/post/o-que-%C3%A9-storytelling
[7] https://crmpiperun.com/blog/tomada-de-decisao/
[8] https://pt.wikipedia.org/wiki/William_Edwards_Deming
Todos os artigos foram acessados em 29/06/2023