AI Agents e a era das IA's autônomas
- #Inteligência Artificial (IA)
Keys: #AgentAI, #GenAI, #LLM
Uma década atrás, treinar uma rede neural para classificar imagens poderia levar cerca de cinco anos. Hoje, a mesma tarefa pode ser feita em minutos.
"Vou precisar de um time de
pesquisadores e cinco anos"
source - xkcd
No ano de 2022, a OpenAI lançava o que seria o bastião da IA Generativa, o ChatGPT. O que viria depois se tornaria rapidamente comum e acessível ao grande público, como o Midjourney, Dall-E e, recentemente, a Gemini.
Essa tecnologia tem algo em comum: elas precisam de um "prompt", uma instrução do que precisa ser feito, o que limita as possibilidades para ambos os dados.
A pergunta precisa ser feita de modo apropriado. Existe, inclusive, um campo inteiro que estuda esse fenômeno, o prompt engineer. Não dominar isso implica subutilizar o LLM (Large Langue Model). Do lado do modelo, ainda usando o prompt adequado, é possível que não seja o que determina a eficiência do modelo. Como seria possível lidar com essa limitação?
AI Agents é uma arquitetura com três componentes: brain, perception e action. Cada um dos componentes desempenha um papel que possibilita a independência da IA.
Brain é o que possibilita o Agente a "pensar", a tomar decisões com base no ambiente. A percepção seria o equivalente à nossa memória, contendo os dados que podem auxiliar o modelo em suas decisões. A action, finalmente, é o gatilho para a ação que será realizada.
Assim como no passado treinar uma rede neural levava meia década e hoje podemos fazer em minutos, a era da IA Generativa está se tornando passado e é possível que estejamos próximos do momento em que vamos coexistir com IAs autônomas.
Referências