image

Acesse bootcamps ilimitados e +650 cursos

50
%OFF
Article image
Mauro Gallotta
Mauro Gallotta03/10/2022 00:09
Compartilhe

O Que Fazer Antes do Machine Learning

  • #Python
  • #Big Data

Para iniciar qualquer processo é fundamental saber o que fazer antes de Machine Learning, as práticas corretas, para depois estudar o tipo de aprendizagem adequada para aplicar no nosso projeto. Por isso vamos entender melhor este processo. Vendo os 9 passos que eu acho necessários e que precisamos fazer antes de chegar até lá no Machine Learning:


PASSO 01 – Resolução do Problema de Negócio

Definir e entender com clareza qual é o problema que precisa resolver, para planejar como resolvê-lo. Está sem alguns dúbios na frente do nosso processo (sem isso não temos como iniciar esta caminhada), este item está nas fundamentais do nosso assunto.


PASSO 02 – processo ETL

Antes de utilizar os dados precisamos fazer uma coleta, acho fundamental passar por um processo conhecido como ETL (EXTRACT, TRANSFORM E LOAD), traduzido em português Extrair, Transformar e Carregar os dados. Este processo é fundamental para que os dados possam ser limpos e prontos para utilizar.


PASSO 03 – Análise Exploratória dos Dados

Em seguida, uma análise exploratória para entender o que os dados estão representando antes de iniciar outros processos. Isso permite ter uma ideia mais clara sobre como trabalhar os dados em relação ao problema de negócio, com o fim de resolver o problema.


PASSO 04 – Limpeza de Dados

Uma boa prática seria durante ou depois de passar de uma análise exploratória, fazer uma boa limpeza dos dados, organizar os dados, eliminado e/ou tratando também outliers, valores duplicados e ausentes.


PASSO 05 – Engenharia de Atributos

Com certeza este passo é fundamental depois da limpeza e antes de chegar ao pré-processamento dos dados, precisamos reorganizar adicionado, eliminando e/ou manipulando os atributos. É tudo isso para preparar se necessário os dados para iniciar o pré-processamento.


PASSO 06 – Pré-processamento dos Dados

Como já antecipado o passo em seguida é o pré-processamento dos dados um passo fundamental para preparação dos dados que usaremos para o nosso trabalho. Um bom pré-processamento permite que a máquina possa ter uma melhor compressão dos dados. E com isso possa resolver o nosso problema no processo de Machine Learning.


PASSO 07 – Divisão Dos Dados em Treino e Teste

Depois que passamos para estas fases anteriores, vamos dividir os dados em treino e teste, para que podemos fornecer os dados e supervisionar os resultados, dividir os dados em 4 blocos o primeiro bloco que fique com 70% até 80% dos dados (chamado dados de treino), lembrando que esta quantidade pode variar em relação aos números de registros do nosso conjunto.


PASSO 08 – Treino

A parte de treino vai ser ainda dividida em 2 pedaços que são X e Y, o X(Que e onde estão armazenados os dados de entrada), Y(Onde estão armazenados os dados de saída). Isso só para treinar o nosso modelo.


PASSO 09 – Analisando e Testando

O restante 20% até 30% vai ser o teste, que permite avaliar o nosso modelo comparando os dados de saída com os dados que temos na mão. Ele também será dividido em 2 partes como no processo precedente, que são X e Y, o X(Que representa e onde estão armazenados os dados de entrada, que para o modelo são novos), Y(Onde estão armazenados os dados de saída que também para o modelo são novos). Mas para em realidade são dados já conhecidos com isso é algumas técnicas que iremos ver mais para a frente, podemos assim avaliar os resultados e entender melhor como está funcionando o nosso modelo.


Ao final, o que faz toda a diferença em um processo de aprendizado de máquina é incluir dados limpos e bem organizados. Para obter os melhores resultados. Por isso é extremamente fundamental entender o que fazer antes de machine learning. Depois os tipos de aprendizagem que você vai aplicar depende do tipo de problema de negócio que quer resolver, que seja uma aprendizagem supervisionada, não supervisionada ou por reforço, vai depender do tipo de projeto que vai fazer. Mas estes passos são os mesmos para todos os processos de aprendizagem.


Espero que isso possa ser útil a todo mundo com o objetivo de melhorar o processo na entrega dos dados para machine learning !

Compartilhe
Comentários (3)
Junio Silva
Junio Silva - 03/10/2022 08:00

Muito bom,

Mauro Gallotta são partes dos ensinamentos que vamos aos poucos aprendendo.

Tudo que e feito com força de vontade e dedicação para o próximo ou para si mesmo e de grande valor.

Meu parabens...

Laio Silva
Laio Silva - 03/10/2022 10:38

Olá, tudo bom?

Esse é um dos temas que mais me atrai.

Qual sua visão sobre controle de qualidade?

Por favor, posso contar com seu voto no artigo abaixo?

DIO| Codifique o seu futuro global agora

Qual sua opinião? Algo a acrescentar?

Desde já, te agradeço!

Priscilla Tomazi
Priscilla Tomazi - 03/10/2022 09:22

Boas dicas! anotado!