Análise de Dados em E-mail Marketing: Melhorando Vendas com Agrupamento K-means
Ao longo da minha jornada profissional, sempre desejei trabalhar com o desenvolvimento de projetos de tecnologia industrial. No entanto, algumas mudanças em minha vida me fizeram perceber que minha paixão e interesses profissionais não estavam plenamente satisfeitos. Tornei-me docente e, por "sorte", assumi a coordenação de um curso superior de tecnologia na área de TI, o que me permitiu conhecer mais profundamente essa área e perceber onde estava meu interesse profissional.
Após uma autoanálise, decidi que era hora de buscar um maior conhecimento na área de dados, começando pela análise de vagas de emprego para cargos como analista de dados, cientista de dados e engenheiro de dados. Ao analisar mais de 70 vagas, percebi que havia dois tipos de exigências: a técnica e a operacional. Embora "operacional" não seja a palavra ideal, foi a mais adequada que encontrei. Demonstrar a primeira é relativamente simples, com habilidades como consultas em SQL, criação de dashboards no Excel, Tableau ou Power BI, que podem ser comprovadas através de cursos e projetos publicados no GitHub. A dificuldade está em como demonstrar habilidades na segunda, como a definição de indicadores para monitorar tendências de mercado ou a extração de insights para a otimização de processos.
Neste artigo, irei compartilhar a abordagem que estou utilizando para desenvolver minhas habilidades operacionais e trabalhar com decisões de negócio baseadas em dados captados através de e-mail marketing.
Analisando dados com e-mail marketing
Muitos negócios utilizam campanhas de e-mail e, ao longo do tempo, coletam dados de compras, criando um histórico por meio do rastreamento de cliques, compras, compartilhamentos sociais, entre outros. Um profissional de dados precisa analisar esse conjunto de dados para compreender melhor a clientela, mas torna-se inviável conhecer individualmente cada cliente. A solução é realizar a segmentação, utilizando uma análise em grupo.
O cenário abordado foi para um comércio atacadista de bebidas, que possui uma linha de vendas de vinhos. Todo mês, é enviado um e-mail informativo com algumas ofertas, detalhando o tipo de produto (champanhe, Malbec, espumante, etc.), quantidade, desconto e outras características. Outra informação disponível é a listagem de clientes e as ofertas que cada um comprou.
Primeiro, é necessário definir uma direção para a análise, toda ação deve ser focada nesse objetivo.
O objetivo desta análise é aumentar as vendas, utilizando os dados para personalizar os informativos para os clientes, segmentando-os por interesses e, assim, gerar mais negócios. Com isso em mente, comecei a organizar os dados para facilitar a visualização. Montei uma tabela dinâmica e criei uma planilha matriz contendo todos os dados, de forma que posso ver quais clientes compraram cada oferta.
Com essa visualização, como identificar o interesse de cada cliente? Utilizando metodologias exploratórias confiáveis como o Agrupamento K-means (este TCC explica bem o que é esse agrupamento: AGRUPAMENTO DE DADOS: K- MÉDIAS ). O processo busca agrupar os clientes em clusters (grupos) baseados na distância aritmética. Como estamos lidando com uma planilha, esse cálculo é feito de forma semelhante à distância vetorial, mas utilizando as coordenadas das células.
O ponto chave é calcular as coordenadas adequadas de cada cluster e, para isso, é necessário utilizar uma ferramenta do Excel chamada Solver. Com ela, é possível, através de alguns parâmetros, obter a melhor combinação para as coordenadas.
Agora, com as coordenadas prontas, basta realizar um cálculo somatório para saber quantos clientes estão mais próximos de cada cluster e analisar as compras através de um filtro. É possível perceber que os clientes mais próximos do cluster 1 são aqueles que procuram ofertas com quantidades menores e verificar quais são os interesses de cada clusters.
Conclusão
Esta é apenas uma análise exploratória que ajuda a conhecer os interesses da clientela, mas ainda é insuficiente para gerar insights adequados ao objetivo da análise. Se você quiser saber a continuação da minha análise (como voicê ja deve ter percebido através das abas nas imagens), deixe um comentário, e eu te explico.
Um abraço e até o próximo artigo.