image

Acesse bootcamps ilimitados e +650 cursos pra sempre

60
%OFF
Article image

CC

Christopher Camilo25/04/2024 23:10
Compartilhe
Microsoft Certification Challenge #3 DP-100Recomendados para vocêMicrosoft Certification Challenge #3 DP-100

Desmistificando Métricas: Escolhendo Efetivamente as Métricas Certas para o seu Problema de Machine Learning

  • #Machine Learning

O que são métricas em machine learning

 

Métricas em machine learning são como réguas que usamos para medir o quão bom um modelo é em resolver um problema. Elas nos dizem o quão bem ou mal nosso modelo está se saindo.

 

Quais as métricas de regressão?

 

Nas regressões, queremos prever um valor contínuo, como o preço de uma casa. Algumas métricas para isso são o Erro Médio Absoluto (MAE), o Erro Quadrático Médio (MSE) e a Raiz do Erro Médio Quadrático (RMSE).

 

O MAE mede a média das diferenças absolutas entre as previsões do modelo e os valores reais. Se o MAE for baixo, significa que nossas previsões estão bem próximas dos valores reais.

 

image

 Ilustração retirada de Hackernoon

O Erro Médio Quadrático (MSE) é a média dos quadrados das diferenças entre as previsões do modelo e os valores reais. Quanto menor o MSE, melhor o modelo está se ajustando aos dados.

 

image

  Ilustração retirada de Hackernoon

O RMSE, por suz vez, é a raiz quadrada do MSE e fornece uma interpretação mais intuitiva, pois está na mesma unidade que os dados originais.

 

image

 

Outros exemplos de métricas para regressão:

 

  • Erro Médio Percentual Absoluto (MAPE): Calcula a média das diferenças percentuais absolutas entre as previsões do modelo e os valores reais. É útil para entender o erro relativo do modelo em relação aos valores reais.
  • Erro Percentual Absoluto Médio (APE): Similar ao MAPE, mas sem a média. Fornece uma visão direta do erro percentual médio entre as previsões e os valores reais.

 

Quais as métricas de classificação?

 

Nas classificações, onde queremos prever categorias como "sim" ou "não", temos métricas como a Acurácia, a Precisão, o Recall e a F1-Score.

 

A Acurácia nos diz a proporção de previsões corretas feitas pelo modelo. Quanto mais próxima de 1, melhor.

 

O Recall, também chamado de Sensibilidade, mede a proporção de positivos reais que foram corretamente identificados pelo modelo. É útil quando o objetivo é minimizar os falsos negativos.

 

A Precisão avalia a proporção de positivos previstos pelo modelo que são realmente positivos. É útil quando queremos ter certeza de que as previsões positivas são confiáveis.

 

Agora, o F1-Score é a média harmônica entre precisão e recall. É útil quando se deseja encontrar um equilíbrio entre precisão e sensibilidade.

 

image

 Ilustração retirada de Medium

Outros exemplos de métricas para classificação:

 

  • Especificidade: Mede a proporção de negativos reais que foram corretamente identificados pelo modelo. É útil quando o objetivo é minimizar os falsos positivos.
  • Matriz de Confusão: Não é exatamente uma métrica, mas uma tabela que mostra as classificações corretas e incorretas feitas pelo modelo em relação aos dados reais. Ajuda a entender melhor os erros do modelo.

image

Imagem retirada de V7 Labs
  • Área sob a curva ROC (AUC-ROC): Avalia a capacidade do modelo de distinguir entre classes. Quanto maior a AUC-ROC (área sob a curva da curva ROC), melhor o modelo é em separar as classes.

image

Imagem retirada de Evidently AI
  • Índice de Jaccard (ou similaridade de Jaccard): Mede a similaridade entre dois conjuntos de amostras. É usado especialmente em problemas de classificação binária para calcular a sobreposição entre o conjunto de previsões e o conjunto de valores verdadeiros.
  • Log Loss (ou Cross-Entropy Loss): É a função de custo usada em problemas de classificação binária ou multiclasse. Avalia a incerteza do modelo atribuída a cada instância, penalizando previsões erradas com alta probabilidade.

 

Conclusões

 

Gostou do conteúdo? Ele foi gerado por inteligência artificial, mas foi revisado por uma pessoa 100% humana. Se você adora ciência de dados tanto quanto eu, vamos nos conectar! Siga-me no LinkedIn 🚀

 

Ilustrações de capa: gerada pela lexica.art

Conteúdo gerado por ChatGPT e revisões humanas

 

#DataScience #MachineLearning

Compartilhe
Recomendados para você
Microsoft AI for Tech - Azure Databricks
Microsoft Certification Challenge #3 DP-100
Decola Tech 2025
Comentários (0)
Recomendados para vocêMicrosoft Certification Challenge #3 DP-100