En gros, depuis que GPT-2 était un bébé dans son berceau de machine, les gens ont essayé de comprendre comment tirer de meilleures pensées de ces amis robots (ou maîtres ?) qui sont les nôtres.
Le standard est ce que j’ai inclus dans un exemple sur les variables dynamiques, appelé aujourd’hui prompting en Chaîne de Pensée, décrit pour la première fois ici, qui consiste à ajouter la ligne suivante à n’importe quel prompt :
Réfléchissons étape par étape.
Les résultats de l’ajout de cette petite ligne étaient dramatiques - text-davinci-002 (alias GPT-3) dans l’article ci-dessus est passé de 17.7 dans un benchmark arithmétique à 78.7.
Et c’est encore couramment utilisé aujourd’hui par les “ingénieurs de prompts”.
Maintenant, pourquoi ça marche ?
Cette simple phrase incite le modèle de langage à décomposer une tâche plus grande en morceaux plus petits, ce qui lui permet de réussir des tâches plus compliquées qu’il ne pourrait gérer seul.
En fait, j’ai trouvé un article cool appelé Self-Discover: Large Language Models Self-Compose Reasoning Structures (Février 2024), qui s’est construit sur Promptbreeder (Je sais… je sais…). Il y a des efforts similaires chez Microsoft et Northeastern, ainsi qu’à l’Université de Tsinghua, comme Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers.
Pour optimiser la résolution de problèmes, des gens ont dépensé des quantités significatives de temps GPU pour que les modèles de langage optimisent leurs propres prompts, créant des prompts uniques pour gérer différents problèmes.
Le modèle de langage adapte ensuite ces prompts spécifiques à la tâche unique, utilisant finalement ce super prompt auto-généré pour répondre beaucoup plus efficacement qu’il ne le ferait à la demande originale.
J’ai une version personnalisée et étendue de cette technique ajustée pour s’adapter aux cas d’usage courants de chat, tout cela disponible pour vous d’un clic sur une modeste case à cocher - “Raisonnement Amélioré”.
J’ai aussi trouvé comment faire cela de manière rentable - j’adorerais entendre votre expérience avec ça pendant que j’ajuste et affine les capacités de raisonnement au travail que vous faites !
N’hésitez pas à envoyer un email à team @ brightrobot.ai pour fournir des retours ou poser des questions - j’adorerais avoir de vos nouvelles.