Engenharia de Prompt: Estruturas, Técnicas e Importância na Interação com Modelos de Linguagem

O que é?

Engenharia de prompt é a prática de formular e ajustar comandos ou perguntas para modelos de linguagem, como o GPT, com o objetivo de obter respostas mais precisas, relevantes ou criativas. Envolve a compreensão profunda de como o modelo interpreta e processa as instruções, permitindo que o usuário refine suas interações para alcançar resultados desejados de forma eficiente e eficaz.

Por que é importante?

A engenharia de prompt é crucial porque determina a qualidade e a relevância das respostas geradas por modelos de linguagem como o GPT. Um prompt bem elaborado pode direcionar o modelo a fornecer informações precisas, soluções criativas ou insights profundos, enquanto um prompt mal formulado pode resultar em respostas vagas ou irrelevantes. Além disso, a engenharia de prompt é essencial para otimizar o uso desses modelos em aplicações práticas, como atendimento ao cliente, criação de conteúdo, pesquisa e automação de tarefas, garantindo que as interações com a IA sejam mais eficientes, seguras e alinhadas aos objetivos do usuário.

Para tornar o conceito mais claro, uma nova pesquisa visou responder a essas questões, apresentando uma compreensão estruturada dos prompts, juntamente com a taxonomia das técnicas de prompting e uma análise sobre prompting em linguagem natural.

O artigo explica os conceitos fundamentais relacionados à engenharia de prompts, como template, estilo de instruções, regras, cadeia, janela de contexto, entre outros.

Também aborda as técnicas de prompt, dividindo-as em 6 categorias:

## Zero Shot

Aqui, fornecemos ao modelo um prompt e uma sequência de texto que descreve o que queremos que o modelo faça, em linguagem natural, sem apresentar exemplos da tarefa desejada sendo concluída. Existem várias técnicas de zero-shot, assim como técnicas de zero-shot combinadas com outros conceitos (por exemplo, Chain of Thought).

## Few Shot

Refere-se à capacidade das IA gerativas de aprender habilidades e tarefas fornecendo-lhes exemplos relevantes dentro do prompt, sem a necessidade de atualizações de peso/treinamento.

## Chain of Thought (CoT) - Cadeia de Pensamento

A cadeia de pensamento abrange uma variedade de técnicas que incentivam o modelo a articular seu raciocínio enquanto resolve um problema, melhorando o desempenho em tarefas como matemática e raciocínio.

## Decomposição

Estratégia de resolução de problemas em que problemas complexos são decompostos em subquestões mais simples (semelhante ao CoT, que também divide os problemas em componentes mais simples). Nessa técnica, os problemas são divididos explicitamente, melhorando a capacidade de resolução de problemas dos modelos. Um exemplo é o "Least-to-Most Prompting", que solicita ao modelo que divida um problema em subproblemas sem resolvê-los e, em seguida, os resolve sequencialmente, anexando as respostas ao prompt cada vez, até chegar a um resultado final.

## Ensembling

Processo de usar múltiplos prompts para resolver o mesmo problema, agregando essas respostas em uma saída final. Em muitos casos, uma votação majoritária (resposta mais frequente) é usada para gerar a saída final. Técnicas de ensembling reduzem a variância das saídas dos modelos e frequentemente melhoram a precisão, embora aumentem o número de chamadas ao modelo necessárias para chegar a uma resposta final.

## Autocrítica

Ao criar sistemas com IA gerativa, pode ser útil que os modelos critiquem suas próprias saídas, fazendo um julgamento da resposta ou fornecendo feedback, que é usado para melhorar a resposta.

Paper: 2406.06608 (arxiv.org)