announcement
4 min read
View as Markdown

Presentamos DB-1: Nuestra Vision de Modelos de Razonamiento como o1

Como DatBot esta empujando los limites del razonamiento de LLM

Robert Soares

Es hora de revelar algo emocionante que ha estado cocinándose en el laboratorio - DB-1, nuestro framework para potenciar las capacidades de razonamiento de LLM.

Queríamos hacer algo nuevo después de crear nuestra función de Razonamiento Mejorado hace un tiempo, y estamos bastante satisfechos hasta ahora, aunque definitivamente lo llamaría un producto beta.

Nota: Aunque esto se muestra en la interfaz como una selección de modelo, bajo el capó es un framework específico envuelto alrededor de otros modelos - no quiero afirmar que estamos haciendo algo que no hacemos aquí, especialmente porque lo que SÍ estamos haciendo es bastante único.

Puede que hayas visto el revuelo alrededor de modelos como o3 y Gemini 2.5, o, si realmente prestas atención, Sky-T1 que pueden razonar escalando “cómputo en tiempo de prueba” - el tiempo que toma responderte, en lugar del tiempo que toma entrenar el modelo originalmente. Bueno, hemos estado trabajando en nuestro propio enfoque, y es… diferente. De una buena manera!

Qué Hace Especial a DB-1?

En lugar de entrenar un modelo de IA completamente nuevo de nivel frontera (que, seamos honestos, cuesta una gran fortuna - aparte del impresionante fine-tune de $450 de Sky-T1), hemos desarrollado un framework que puede envolver modelos LLM existentes como un acogedor suéter de supercerebro.

Construimos barandas arquitectónicas específicas y prompts de razonamiento que permiten a los modelos (existentes!) abordar problemas de manera flexible. Este enfoque permite que los LLMs reevalúen suposiciones anteriores y desafíen procesos de razonamiento de una manera un poco más sofisticada que decir “pensemos paso a paso” (aunque ese truco todavía funciona bien! Se conoce como cadena de pensamiento, si no has oído hablar de él - y si no has intentado usarlo en tus propios prompts, inténtalo, podrías sorprenderte de lo bien que funciona!).

La Salsa Secreta de DatBot (Bueno, Algo de Ella)

Aunque no voy a explicar exactamente cómo funciona DB-1, ya que es mi propio enfoque personal (Puedes tener una idea de ello simplemente leyendo la salida - DatBot expone todo el proceso de razonamiento), esto es lo que puedo decir:

  • Es un framework, no un modelo - lo que significa que puedo usarlo con diferentes LLMs - lo he probado con algunos, y funciona mejor con unos que con otros.
  • Usa técnicas avanzadas de prompting (permitiendo que modelos sin razonamiento razonen como o1 o QwQ (en el que Sky-T1 se basa - nota que tenemos tanto QwQ como o1 disponibles en DatBot para que los pruebes).
  • Tiene barandas arquitectónicas incorporadas para mantener el razonamiento en curso.
  • Permite una salida autoconsistente mucho más larga que cualquier otro modelo, incluyendo las respuestas de o1 y QwQ.
  • Funciona bien para tareas creativas, a diferencia de los modelos de razonamiento tradicionales, debido a cómo maneja el proceso de razonamiento.
  • Todavía ocasionalmente se… pierde en pensamientos, y da error. Así que trátalo un poco como a un despistado, y por favor no te molestes si consume algunos créditos de vez en cuando - solo está perdido en pensamientos!
  • advertencia - Si usas Sherlock como tono con él… prepárate para algunos… resultados muy largos. Excelente análisis, solo… largo. Muy largo.

La Ciencia Detrás de Él

Somos solo uno en una larga línea de investigadores que prueban diferentes versiones de escalar el cómputo en tiempo de prueba. Investigaciones de DeepMind, publicadas aquí como ejemplo, “Scaling LLM Test-Time Compute Optimally”, muestran que el uso inteligente del cómputo en tiempo de prueba (es decir, al responderte) puede ser más eficiente que entrenar un modelo más grande. De hecho, encontraron que, optimizado, un modelo más pequeño podía igualar el rendimiento de un modelo 14 veces su tamaño!

Nuestro framework toma este tipo de perspectiva y la aplica de una manera práctica, (mayormente) lista para producción que luego podemos exponerte.

Por Qué Esto Importa

Mira, entrenar modelos masivos es increíble - no estaríamos aquí sin ello, pero no todos tienen acceso a decenas de millones de dólares en presupuesto de cómputo (tristemente, ni siquiera nosotros). Queríamos crear algo que pudiera democratizar capacidades de razonamiento avanzado - algo que pudiera funcionar con los modelos a los que ya tienes acceso, y que podamos mejorar en conjunto con los gigantes de la industria, para hacer que su trabajo se extienda aún más para el resto de nosotros.

Qué Sigue?

Todavía estamos ajustando DB-1, y nos encantaría saber de ti! Cómo lo estás usando?

Qué tipos de tareas le has lanzado? Funcionaron? Fallaron miserablemente? Envíanos tus pensamientos a [email protected] con experiencias o preguntas.

Ready For DatBot?

Use Gemini 2.5 Pro, Llama 4, DeepSeek R1, Claude 4, O3 and more in one place, and save time with dynamic prompts and automated workflows.

Top Articles

Come on in, the water's warm

See how much time DatBot.AI can save you