Basicamente, desde que o GPT-2 era um bebê no seu berço de máquina, as pessoas têm tentado descobrir como extrair melhores pensamentos desses nossos amigos robôs (ou senhores?).
O padrão é o que eu incluí em um exemplo sobre variáveis dinâmicas, chamado hoje de prompting de Cadeia de Pensamento, descrito pela primeira vez aqui, que é adicionar a seguinte linha a qualquer prompt:
Vamos pensar passo a passo.
Os resultados de adicionar essa pequena linha foram dramáticos - text-davinci-002 (também conhecido como GPT-3) no artigo acima foi de 17.7 em um benchmark de aritmética para 78.7.
E isso ainda é comumente usado hoje por “engenheiros de prompt”.
Agora, por que isso funciona?
Essa frase simples induz o modelo de linguagem a quebrar uma tarefa maior em pedaços menores, o que permite que ele tenha sucesso em tarefas mais complicadas do que conseguiria por conta própria.
Basicamente, encontrei um artigo legal chamado Self-Discover: Large Language Models Self-Compose Reasoning Structures (Fevereiro, 2024), que se baseou em Promptbreeder (Eu sei… eu sei…). Há esforços semelhantes na Microsoft e Northeastern, assim como na Universidade de Tsinghua, como Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers.
Para otimizar a resolução de problemas, pessoas gastaram quantidades significativas de tempo de GPU para que modelos de linguagem otimizassem seus próprios prompts, criando prompts únicos para lidar com diferentes problemas.
O modelo de linguagem então adapta esses prompts específicos à tarefa única, finalmente usando esse super prompt auto-gerado para responder muito mais efetivamente do que faria à solicitação original.
Eu tenho uma versão personalizada e expandida dessa técnica ajustada para se adequar a casos de uso comuns de chat, tudo disponível para você com o clique de uma caixa de seleção modesta - “Raciocínio Aprimorado”.
Também descobri como fazer isso de uma maneira econômica - adoraria ouvir sua experiência com isso enquanto ajusto e afino as capacidades de raciocínio para o trabalho que você está fazendo!
Fique à vontade para enviar um e-mail para team @ brightrobot.ai para fornecer feedback ou fazer qualquer pergunta - adoraria ouvir de você.