announcement
4 min read
View as Markdown

Apresentando DB-1: Nossa Versao de Modelos de Raciocinio como o1

Como o DatBot esta empurrando os limites do raciocinio de LLM

Robert Soares

É hora de revelar algo empolgante que estava cozinhando no laboratório - DB-1, nosso framework para turbinar as capacidades de raciocínio de LLM.

Queríamos fazer algo novo depois de criar nosso recurso de Raciocínio Aprimorado um tempo atrás, e estamos bastante satisfeitos até agora, embora eu definitivamente chamaria de um produto beta.

Nota: Embora isso seja mostrado na interface como uma seleção de modelo, por baixo dos panos é um framework específico envolvido em torno de outros modelos - não quero afirmar que estamos fazendo algo que não estamos aqui, especialmente porque o que ESTAMOS fazendo é bastante único.

Você pode ter visto o burburinho em torno de modelos como o3 e Gemini 2.5, ou, se você realmente presta atenção, Sky-T1 que conseguem raciocinar escalando “computação em tempo de teste” - o tempo que leva para responder você, ao invés do tempo que leva para treinar o modelo originalmente. Bem, estivemos trabalhando em nossa própria abordagem, e é… diferente. De um jeito bom!

O Que Torna o DB-1 Especial?

Em vez de treinar um modelo de IA completamente novo de nível fronteira (que, sejamos honestos, custa uma fortuna - o impressionante fine-tune de $450 do Sky-T1 à parte), desenvolvemos um framework que pode envolver LLMs existentes como um aconchegante suéter de supercérebro.

Construímos barreiras arquitetônicas específicas e prompts de raciocínio que permitem que modelos (existentes!) abordem problemas de forma flexível. Essa abordagem permite que LLMs reavaliem suposições anteriores e desafiem processos de raciocínio de uma forma um pouco mais sofisticada do que dizer “vamos pensar passo a passo” (embora esse truque ainda funcione bem! É conhecido como cadeia de pensamento, se você não ouviu falar - e se você não tentou usar em seus próprios prompts, dê uma chance, você pode se surpreender com o quão bem funciona!).

O Molho Secreto do DatBot (Bem, Parte Dele)

Embora eu não vá explicar exatamente como o DB-1 funciona, já que é minha própria abordagem pessoal (Você pode ter uma noção disso apenas lendo a saída - o DatBot expõe todo o processo de raciocínio), aqui está o que posso dizer:

  • É um framework, não um modelo - o que significa que posso usá-lo com diferentes LLMs - testei com alguns, e funciona melhor com uns do que com outros.
  • Usa técnicas avançadas de prompting (permitindo que modelos sem raciocínio raciocionem como o1 ou QwQ (no qual o Sky-T1 é modelado - note que temos tanto QwQ quanto o1 disponíveis no DatBot para você experimentar).
  • Tem barreiras arquitetônicas incorporadas para manter o raciocínio no caminho certo.
  • Permite saída autoconsistente muito mais longa do que qualquer outro modelo, incluindo respostas de o1 e QwQ.
  • Funciona bem para tarefas criativas, ao contrário de modelos de raciocínio tradicionais, devido a como lida com o processo de raciocínio.
  • Ainda ocasionalmente fica… perdido em pensamentos, e dá erro. Então trate-o um pouco como um distraído, e por favor não fique chateado se ele consumir alguns créditos de vez em quando - ele só está perdido em pensamentos!
  • aviso - Se você usar Sherlock como tom com ele… prepare-se para alguns… resultados muito longos. Excelente análise, só… longa. Muito longa.

A Ciência Por Trás Disso

Somos apenas um em uma longa linha de pesquisadores que experimentam diferentes versões de escalar computação em tempo de teste. Pesquisas da DeepMind, publicadas aqui, como exemplo, “Scaling LLM Test-Time Compute Optimally”, mostram que o uso inteligente de computação em tempo de teste (ou seja, ao responder você) pode ser mais eficiente do que treinar um modelo maior. Na verdade, eles descobriram que, otimizado, um modelo menor poderia igualar o desempenho de um modelo 14 vezes seu tamanho!

Nosso framework pega esse tipo de insight e aplica de forma prática, (principalmente) pronta para produção que podemos então expor para você.

Por Que Isso Importa

Olha, treinar modelos massivos é incrível - não estaríamos aqui sem isso, mas nem todo mundo tem acesso a dezenas de milhões de dólares em orçamento de computação (tristemente, nem mesmo nós). Queríamos criar algo que pudesse democratizar capacidades avançadas de raciocínio - algo que pudesse funcionar com os modelos aos quais você já tem acesso, e que possamos melhorar em conjunto com os gigantes da indústria, para fazer o trabalho deles se estender ainda mais para o resto de nós.

O Que Vem a Seguir?

Ainda estamos ajustando o DB-1, e adoraríamos ouvir de você! Como você está usando?

Que tipos de tarefas você jogou para ele? Funcionaram? Falharam miseravelmente? Mande seus pensamentos para [email protected] com experiências ou perguntas.

Ready For DatBot?

Use Gemini 2.5 Pro, Llama 4, DeepSeek R1, Claude 4, O3 and more in one place, and save time with dynamic prompts and automated workflows.

Top Articles

Come on in, the water's warm

See how much time DatBot.AI can save you