guide
2 min read
View as Markdown

Qué significa "Razonamiento Mejorado" y por qué nadie más lo tiene

Esto no es para todos los casos de uso - ¡pero sí para la mayoría!

Robert Soares

Básicamente, desde que GPT-2 era un bebé en su cuna de máquina, la gente ha estado tratando de descubrir cómo sacar mejores pensamientos de estos amigos robots (¿o amos?) nuestros.

El estándar es lo que incluí en un ejemplo sobre variables dinámicas, llamado hoy en día prompting de Cadena de Pensamiento, descrito por primera vez aquí, que es agregar la siguiente línea a cualquier prompt:

Pensemos paso a paso.

Los resultados de agregar esa pequeña línea fueron dramáticos - text-davinci-002 (también conocido como GPT-3) en el artículo anterior pasó de 17.7 en un benchmark de aritmética a 78.7.

Y eso todavía se usa comúnmente hoy por los “ingenieros de prompts”.

Ahora, ¿por qué funciona eso?

Esa simple frase incita al modelo de lenguaje a desglosar una tarea más grande en fragmentos más pequeños, lo que le permite tener éxito en tareas más complicadas de las que podría manejar por sí solo.

Básicamente, encontré un artículo genial llamado Self-Discover: Large Language Models Self-Compose Reasoning Structures (Febrero, 2024), que se basó en Promptbreeder (Lo sé… lo sé…). Hay esfuerzos similares en Microsoft y Northeastern, así como en la Universidad de Tsinghua, como Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers.

Para optimizar la resolución de problemas, la gente gastó cantidades significativas de tiempo de GPU para que los modelos de lenguaje optimizaran sus propios prompts, creando prompts únicos para manejar diferentes problemas.

El modelo de lenguaje luego adapta esos prompts específicos a la tarea única, finalmente usando ese super prompt auto-generado para responder mucho más efectivamente de lo que lo haría a la solicitud original.

Tengo una versión personalizada y expandida de esta técnica ajustada para adaptarse a casos de uso comunes de chat, todo lo cual está disponible para ti con un clic de una casilla de verificación modesta - “Razonamiento Mejorado”.

También descubrí cómo hacer esto de una manera rentable - ¡me encantaría escuchar tu experiencia con esto mientras ajusto y afino las capacidades de razonamiento al trabajo que estás haciendo!

No dudes en enviar un correo electrónico a team @ brightrobot.ai para proporcionar comentarios o hacer cualquier pregunta - me encantaría saber de ti.

Ready For DatBot?

Use Gemini 2.5 Pro, Llama 4, DeepSeek R1, Claude 4, O3 and more in one place, and save time with dynamic prompts and automated workflows.

Top Articles

Come on in, the water's warm

See how much time DatBot.AI can save you