AI Agents e a era das IA's autônomas

#Inteligência Artificial (IA)

Keys: #AgentAI, #GenAI, #LLM

Uma década atrás, treinar uma rede neural para classificar imagens poderia levar cerca de cinco anos. Hoje, a mesma tarefa pode ser feita em minutos.

"Vou precisar de um time de

pesquisadores e cinco anos"

source - xkcd

No ano de 2022, a OpenAI lançava o que seria o bastião da IA Generativa, o ChatGPT. O que viria depois se tornaria rapidamente comum e acessível ao grande público, como o Midjourney, Dall-E e, recentemente, a Gemini.

Essa tecnologia tem algo em comum: elas precisam de um "prompt", uma instrução do que precisa ser feito, o que limita as possibilidades para ambos os dados.

A pergunta precisa ser feita de modo apropriado. Existe, inclusive, um campo inteiro que estuda esse fenômeno, o prompt engineer. Não dominar isso implica subutilizar o LLM (Large Langue Model). Do lado do modelo, ainda usando o prompt adequado, é possível que não seja o que determina a eficiência do modelo. Como seria possível lidar com essa limitação?

AI Agents é uma arquitetura com três componentes: brain, perception e action. Cada um dos componentes desempenha um papel que possibilita a independência da IA.

Brain é o que possibilita o Agente a "pensar", a tomar decisões com base no ambiente. A percepção seria o equivalente à nossa memória, contendo os dados que podem auxiliar o modelo em suas decisões. A action, finalmente, é o gatilho para a ação que será realizada.

Assim como no passado treinar uma rede neural levava meia década e hoje podemos fazer em minutos, a era da IA Generativa está se tornando passado e é possível que estejamos próximos do momento em que vamos coexistir com IAs autônomas.

Referências

The Rise Of The IA Engineer

Intro of AI agent, & AI agent projects summary

Introducing ChatGPT

Prompt Enginner - Real Python