image

Access unlimited bootcamps and 650+ courses

50
%OFF
Article image
Fernanda Mancini
Fernanda Mancini09/01/2025 11:05
Share

Detectando Fake News com Machine Learning

  • #Python
  • #Banco de Dados

Em um mundo onde a informação se propaga em segundos, a disseminação de Fake News tornou-se um desafio significativo para a sociedade. Mas como a tecnologia pode ser uma aliada no combate a esse problema? Neste artigo, exploramos a construção de um Detector de Fake News utilizando Machine Learning e Processamento de Linguagem Natural (NLP), demonstrando como a Inteligência Artificial pode contribuir para o bem-estar social.

Como foi feito?

Para este projeto, utilizamos o dataset de Fake News disponível em: https://huggingface.co/datasets/ErfanMoosaviMonazzah/fake-news-detection-dataset-English?row=6

Este conjunto de dados contém títulos, textos e rótulos indicando se a notícia é verdadeira ou falsa. Para preparar os dados, aplicamos a técnica TF-IDF (Term Frequency-Inverse Document Frequency), que atribui maior peso a palavras frequentes em um documento, mas raras no restante do corpus, permitindo que o modelo se concentre nos termos mais relevantes.

Além disso, utilizamos o algoritmo Naive Bayes, que se destaca pela sua simplicidade e eficiência em tarefas de classificação textual. Esse algoritmo calcula probabilidades para determinar se uma notícia pertence à categoria "Real" ou "Fake", com base nas palavras presentes no texto.

Resultados

O modelo alcançou uma acurácia de 92,46%, prevendo corretamente uma notícia do New York Times, o que demonstra sua eficácia na tarefa de classificação.

Conclusão

Este projeto evidencia o potencial do Machine Learning e do NLP na resolução de problemas reais. A Inteligência Artificial pode ser uma ferramenta poderosa no combate à desinformação, incentivando o pensamento crítico e protegendo a sociedade. No entanto, é importante notar que, devido à subjetividade das notícias, o modelo pode apresentar erros e vieses, não substituindo a análise humana.

Código no GitHub

Se você deseja acessar o código completo, ele está disponível no GitHub: https://github.com/FernandaMancini/Fake-News-Detection-with-Machine-Learning/tree/main

O código é simples e pode apresentar algumas limitações, portanto estou aberta a contribuições para aprimorá-lo.

Este é o meu primeiro artigo, então também aceito dicas de escrita. Muito obrigada pela atenção.

Share
Comments (1)
Carlos Lima
Carlos Lima - 09/01/2025 19:32

Oi Fernanda, que incrível. Parabéns (Requer paciência a leitura dos dados, a API do HF). Eu gostaria de poder sugerir um desafio que pode contribuir com seu aprendizado um tanto. Usados os modelos pré-treinados do próprios HuggingFace. BERT, por exemplo.


Tempos atrás eu usei um dataset para aplicar FINE-TUNING ao BERT justamente para detectar FakeNews.


OBS: A escolha do Naive Bayes é uma sábia escolha, apesar de ter limitações é ágil (por ser um modelo generativo). Um mudança simples que lhe daria melhores resultados seria utilizar o modelo Logistic Regression.