O Futuro da Tecnologia que Está Transformando o Mundo
Já imaginou um futuro onde máquinas são capazes de desempenhar funções complexas, aprender como o cérebro aprende? Pois bem, isso já é possível graças à inteligência artificial, um termo que tomou a mídia depois do lançamento do ChatGPT, que revolucionou o mundo com sua capacidade de conversas cordiais e sua habilidade de entender nossas perguntas e nos ajudar a resolver problemas.
Não é apenas o ChatGPT, mas diversas outras IA utilizam o mesmo princípio para aprender. A chave para isso é machine learning ou aprendizado de máquina, onde simplesmente um programa de computador recebe uma quantia de dados rotulados e não rotulados. Esses rótulos são explicações do que se trata esses dados. Além dos dados e dos rótulos, temos as instruções que são passadas junto.
As instruções podem ser "encontre todas as imagens que contêm gatos" ou "categorize esses tipos de flores". Em seguida, o programa irá procurar padrões nos dados para atingir seus objetivos. Às vezes, o programa recebe penalidades do tipo "essa imagem não é um gato", "isso não é uma flor, é um vegetal", mas com o tempo esse programa irá aprender com esses dados, a um ponto em que sua capacidade de diferenciar vegetais de uma flor será muito precisa.
Nesse exemplo abordado utilizando a flor e o gato, os dados utilizados para treinar esse programa definem as habilidades desse programa. Esse processo é uma forma simples de explicar o aprendizado de máquina. Para tornar mais simples ainda, utilize os seres humanos como exemplo: ao longo de milhões de anos, o ambiente natural nos levou a desenvolver habilidades específicas. Da mesma maneira, um programa utiliza dados e processa esses dados, moldando a maneira como se desenvolve e levando a modelos de IA específicos.
Sim, é isso mesmo que você está pensando. Diferente de um programa de computador que é programado utilizando uma linguagem de programação e um programador para passar as instruções a esse computador, construindo esse programa como um pedreiro construindo uma casa, um programa inteligente ou um algoritmo inteligente aprende através de dados. Você não precisa necessariamente programar o aplicativo ou criar o algoritmo, você apenas fornece os dados ao algoritmo de IA e ele aprende sozinho. Seu papel é como um treinador que irá verificar se o treinamento está ocorrendo como esperado, e é esse fato que torna as IAs inteligentes e cheias de habilidades incríveis.
Os chatbots, assim como as IAs específicas mencionadas acima, são grandes modelos de algoritmos treinados em grandes volumes de dados, ou MLLs. Um MLL é capaz de considerar não apenas palavras, mas também frases, e fazer comparações de palavras e frases utilizando seus dados de treinamento. Seus dados são bilhões de palavras e frases que fazem comparações entre si, tornando-o capaz de ler suas perguntas e gerar respostas em grande escala.
Esses modelos de linguagem podem aprender as regras da gramática e descobrir significados das palavras sem a ajuda humana.
Provavelmente você já utilizou a Alexa, Siri, ou Ok Google, que utiliza a Gemini hoje em dia. Essas IAs são capazes de gravar o som de sua voz enquanto você fala. Além disso, ela remove o ruído de fundo e separa sua fala em unidades fonéticas (sons individuais que compõem uma palavra falada). Em seguida, ela compara utilizando uma biblioteca de sons de linguagem. Sua fala depois é convertida em texto, onde se houver algum erro de escuta, podem ser corrigidos antes que uma resposta possa ser dada. Esse tipo de IA adquiriu essa habilidade, chamada Processamento de Linguagem Natural, ou PNL.
Aposto que você já utilizou algum aplicativo de gerenciamento de fotos onde ele separa suas imagens por categoria, como por exemplo, no endereço tal, ou separa por rostos de pessoas etc. Isso é apenas um algoritmo de IA aprendendo através dos seus dados. Ela está aprendendo os padrões da sua foto agrupando sem você perceber.
Esses aplicativos ou funções do celular utilizam uma IA que foi treinada examinando grandes quantidades de imagens, todas com uma etiqueta ou rótulos com uma simples descrição.
Se você eventualmente é uma pessoa muito organizada e ama tirar fotos, e possui uma conta no Google Fotos onde armazena todas as suas imagens, às vezes o aplicativo pergunta a você quem seria uma certa pessoa em uma foto e quem seria a outra em outra foto. Ele aprende a diferenciar as imagens e os rostos das pessoas, e se você ainda responder a esse algoritmo o nome do seu amigo, ele irá classificar todas as imagens que possuem seu amigo com o nome que você forneceu. Essa IA reconhece imagens com precisão. Esse é um princípio básico de como o Reconhecimento Facial funciona, encontrando uma relação sutil entre características do rosto que o tornam diferente e único quando comparado a todos os outros rostos do planeta.
O reconhecimento facial foi adaptado para modelos de IA que aprenderam a habilidade de manipular padrões e cores. Essas IAs que geram imagens aprenderam a transformar padrões visuais complexos que foram coletados de milhares de fotografias e desenhos em imagens novas. Já há centenas de ferramentas que geram imagens muito criativas, como uma pessoa andando em Marte ou um gato astronauta, imagens realistas, ou você pode também pedir uma imagem utilizando as técnicas de pintura de Van Gogh.
As IAs que geram imagem utilizam uma coleção de pixels coloridos aleatoriamente. Ela simplesmente procura nos pontos aleatórios qualquer variação de um padrão que aprendeu em seu treinamento.
Os carros autônomos despertam o fascínio de muita gente há muitos anos, seja por causa de filmes de ficção que mais causaram impacto no imaginário de várias pessoas.
Com a IA, essa imaginação pode se tornar verdade utilizando algo chamado Direção Autônoma. Os carros são equipados com câmeras, radares e lasers de detecção de alcance. Um carro com visão em 360 graus e sensores em vários pontos do carro obtém dados do mundo que detecta objetos e verifica se esses objetos estão se movendo e, caso afirmativo, que tipo de objeto em movimento eles são.
Depois de ler esse artigo, você percebeu que o combustível para uma IA são os dados, e hoje existe uma frase bem famosa que diz "os dados são o novo petróleo deste século". Hoje os dados são tão importantes por causa do avanço da tecnologia que leis como LGPD foram criadas para proteger seus dados.
Não é preciso muito esforço para descobrir isso. Já existem várias informações suas, financeiras e sociais, online, que podem ser usadas para fazer previsões sobre seu comportamento. Desde cartões de fidelidade no supermercado que sabem seus hábitos e gostos através de suas compras, até agências de crédito que rastreiam quanto você possui no banco e quanto você deve em seus cartões de crédito.
Aposto que se você utiliza muito Uber, alguns dias você já deve ter recebido em seu e-mail ofertas e tickets de desconto. Além de a cada 100 viagens ou mais, o Uber te manda um histórico em um lindo dashboard mostrando os lugares que você mais utilizou o Uber, quantidade de viagens, até o modelo de carro que você mais viajou.
Isso simplesmente existe para todos, não importa quem seja. Esses dados todos permitem que modelos de IA os utilizem buscando tendências. Esses modelos estão moldando sua vida e a forma como você decide, desde se você pode obter um empréstimo até influenciar o que você compra, até escolhendo os filmes que você mais assiste na Netflix. Nunca se perguntou como a Netflix sempre acerta no seu gosto?
Talvez você pense: podemos criar uma IA híbrida com todas essas funções e habilidades mencionadas? Atualmente caminhamos para esse cenário, uma IA híbrida com várias habilidades. E o nome para esse modelo é IA multimodal. Esse modelo é capaz de analisar diferentes tipos de dados como imagens, textos, áudio e vídeo, e descobrir padrões novos nesses dados.
Hoje já há várias IAs multimodais, mas as mais famosas são a Gemini da Google e o ChatGPT da OpenAI. O modelo ChatGPT-3 era treinado apenas em texto. Já no modelo ChatGPT-4, ele era treinado com imagens.
Mas o que torna uma IA híbrida poderosa não é apenas para chatbots. Essa ideia de IA híbrida traz à tona a possibilidade de um modelo inteligente que antes era treinado apenas com texto poder ser treinado com imagens, vídeos e, consequentemente, podemos utilizar isso para criar novos medicamentos, reconhecer imagens de câncer e testar inúmeras possibilidades de tratamentos com maior possibilidade de cura. Essa ideia é conhecida também como Inteligência Geral Artificial, ou AGI.
A AGI é o objetivo final das pesquisas em inteligência artificial. Estamos caminhando para esse futuro, mas os passos são lentos. Ainda há muitos estudos a serem feitos, e quando chegarmos lá, a inteligência artificial que conhecemos hoje será uma inteligência que fugirá de nossa compreensão e que não seremos capazes de controlar.
Os avanços mais notórios foram possíveis pelo aprendizado profundo. O aprendizado profundo utiliza algoritmos complexos e enormes quantidades de dados. Se no machine learning os algoritmos já eram de certa forma complexos, no aprendizado profundo o patamar é ainda maior.
E é nessa área da IA onde o complexo realmente faz parte. Aqui os algoritmos aprendem sem nenhuma orientação humana. Diferente dos exemplos anteriores onde utilizavam-se humanos para treinar a IA, aqui a IA definitivamente aprende sem a orientação humana.
Podemos citar como exemplo o ChatGPT e a Gemini. A internet possui quantidades exorbitantes de textos, como livros digitais, e os algoritmos da Gemini e do ChatGPT são capazes de utilizar esses textos na internet para aprender sozinhos, combinando palavras e frases.
Para simplificar ainda mais, imagine que você tenha pilhas de livros e arquivos que possuem textos e imagens, independentemente do idioma. Eventualmente, você descobre que uma palavra aparece em uma página e essa palavra sempre se refere a uma imagem. Em seguida, você também percebe que ao lado das palavras há artigos como "o", "a" que ligam uma palavra a outra.
Esse exemplo simplista é como uma inteligência profunda funciona ou aprendizado não supervisionado.
Esse tipo de aprendizado depende de uma enorme quantidade de poder computacional, pois a IA precisa memorizar uma grande quantidade de palavras possíveis sozinha, e depois de aprender as palavras, precisa descobrir as comparações dessas palavras, ou seja, como elas são usadas, e tudo isso em frações de segundo.
É normal a estranheza em algo que nunca esteve em nosso dia a dia e, de repente, ganha os noticiários. A IA, mesmo estando no nosso meio há vários anos, não começou seus estudos em 2022, mas o avanço da tecnologia atual e a quantia de dados que criamos todos os dias tornaram a IA possível hoje em dia.
Ainda estamos aprendendo a lidar com os impactos da IA. Na criação de imagens, por exemplo, há uma discussão em relação aos direitos autorais e à ética de criação de obras de arte que foram treinadas a partir de trabalhos de verdadeiros artistas, designers e fotógrafos.
Os carros autônomos trazem um sentimento de ansiedade. Legislações governamentais e reguladores de segurança buscam saber mais a fundo o que acontece quando entregamos o controle a máquinas automatizadas em nossas estradas. Além dos propósitos hostis da humanidade utilizando IA, os EUA fizeram um treinamento utilizando uma IA para pilotar um caça. Seu desempenho foi tão perspicaz que igualou ou foi melhor que o de um piloto de caça humano.
Já a China possui um dos maiores sistemas de reconhecimento facial do mundo, que é capaz de encontrar qualquer pessoa em qualquer lugar do território chinês. O sistema é perfeito contra a criminalidade, mas o sistema comunista da China utiliza-o para monitorar a população chinesa.
Aposto que você já se perguntou se a inteligência artificial pode roubar seu emprego. A resposta ainda é simples: a inteligência que possuímos hoje não é capaz de roubar o emprego de alguém ainda. Mas, assim como na Revolução Industrial, depois na era da Internet e do computador, uma nova forma de se trabalhar está surgindo. A revolução da IA vem trazendo uma ferramenta importante, que em breve você será questionado se sabe usar uma IA ou não.
Se você gostou deste artigo e deseja se manter atualizado sobre as últimas tendências e discussões em tecnologia e inteligência artificial, me siga no LinkedIn! e no GitHub Juntos, podemos explorar e compreender melhor o futuro tecnológico que está se desenrolando diante de nós.
Referências
Este artigo teve como base meu curso na Facti, "Inteligência Artificial Aplicada à Visão Computacional", e meus estudos pessoais sobre o tema. Além disso, a imagem de capa foi gerada na plataforma Copilot e as imagens dos títulos foram obtidas no site lexica.
Ressalto que todo o conteúdo deste artigo é de autoria humana, sem o uso de inteligência artificial para a criação do texto em si. Agradeço a todos os educadores e recursos que contribuíram para o desenvolvimento deste conteúdo.
#Inteligencia artificial #IA #aprendizado de maquina