guide
8 min read
View as Markdown

Lista de Modelos Disponiveis no DatBot

O que temos, por que temos, de onde vem (e o que e "isso" afinal?)

Robert Soares
Visão Geral dos Modelos Disponíveis no DatBot

DatBot Blends

  • Fast Blend: Uma mistura de modelos incríveis que retornam >200 tokens/segundo no mínimo de nossos parceiros, visando o nível de qualidade do ChatGPT.
  • HQ Blend: Nosso blend mais lento, mas de qualidade incrivelmente alta, incluindo alguns dos melhores modelos disponíveis a qualquer momento.
  • Thinking Blend: Modelos de pensamento de alta qualidade de diferentes laboratórios de fronteira para garantir que diferentes arquiteturas colaborem em suas respostas.
  • Cascade (Cascata de Perspectivas): Múltiplos modelos explorando diferentes perspectivas, sintetizando uma saída final mais valiosa do que um único modelo poderia.
  • DB-1 (Raciocínio Profundo): Raciocínio de saída longa - capaz de lidar com projetos mais longos com necessidades mais complexas.
  • DB-1 Flash (Raciocínio Profundo Flash): Versão ultra-rápida do Raciocínio Profundo, combinando raciocínio de saída longa com rapidez.

Os DatBot Blends e Cascata de Perspectivas são, até onde sei, a primeira vez que modelos “de fronteira” foram colocados em uma capacidade de geração mesclada para melhorar seu desempenho. Você pode ler mais sobre isso no post do DatBot sobre blends, aqui. Sem origem única aqui!

Deep Reasoning e Deep Reasoning Flash foram alguns dos primeiros sucessos reais em gerar saídas longas mais fortes - agora os modelos de raciocínio estão melhorando nisso nativamente, e isso leva os melhores modelos a outro nível ainda.


Modelos da OpenAI

Modelos de Pensamento:

  • GPT-5.1: O modelo de pensamento mais recente e avançado da OpenAI, com raciocínio adaptativo que ajusta dinamicamente o tempo de pensamento com base na complexidade da tarefa
  • GPT-5.1 Codex: Modelo de pensamento de tamanho completo focado em código, treinado nativamente para fluxos de trabalho de código agêntico
  • GPT-5.1 Codex Mini: Versão menor e mais rápida do GPT-5.1 focada em código
  • GPT-5.1 Low: Variante de baixo esforço de raciocínio para respostas mais rápidas
  • GPT-5.1 High: Variante de alto esforço de raciocínio para problemas complexos
  • GPT-OSS-120b: Modelo de pensamento de código aberto da OpenAI com 120 bilhões de parâmetros
  • GPT-5 Mini: Versão menor e mais rápida do GPT-5
  • GPT-5 Nano: A menor variante do GPT-5, ótima para tarefas simples

Modelos Sem Pensamento:

  • GPT-5.1 Chat (Versão ChatGPT): Variante sem pensamento do GPT-5.1, exatamente igual ao ChatGPT
  • GPT-4o: O modelo que o ChatGPT costumava usar (agora desatualizado, use GPT-5.1 Chat em vez disso)

Os modelos da OpenAI estão na vanguarda da tecnologia de IA, empurrando os limites do que a IA pode realizar. Eles provaram o que é possível. Intimamente parceiros da Microsoft.


Modelos da Anthropic

Modelos de Pensamento:

  • Claude Opus 4.5 (Thinking): O modelo mais avançado do Claude com capacidades de pensamento/raciocínio
  • Claude Sonnet 4.5 (Thinking): Sonnet 4.5 com capacidades de pensamento para raciocínio complexo
  • Claude Haiku 4.5 (Thinking): Modelo de pensamento ultra-rápido, oferece desempenho de código similar ao Claude Sonnet 4 a um terço do custo e mais que o dobro da velocidade

Modelos Sem Pensamento:

  • Claude Opus 4.5: Variante sem pensamento, excelente para escrita criativa
  • Claude Sonnet 4.5: Variante sem pensamento, excelente para código e tarefas gerais

Os modelos ‘Sonnet’ tendem a ser os de melhor preço/desempenho - Sonnet 4.5 é um modelo de código incrível, por exemplo (eu uso o tempo todo). Opus é frequentemente o melhor escritor, a qualquer preço. Haiku 4.5 agora oferece capacidade notável em velocidade fulminante - há apenas seis meses, esse nível de desempenho teria sido o estado da arte.


Modelos do Google

Modelos de Pensamento:

  • Gemini 3 Pro (Thinking): O modelo de raciocínio mais avançado do Google, com mais de 50% de melhoria em tarefas de benchmark resolvidas vs Gemini 2.5 Pro, com janela de contexto de 1M tokens
  • Gemini 2.5 Flash (Thinking): Modelo de pensamento de alta velocidade do Google

Modelos Sem Pensamento:

  • Gemini 2.5 Flash: O melhor modelo de alta velocidade do Google sem pensamento
  • Gemini 2.0 Flash: Excelente relação preço-desempenho

Google é… bem, Google. Eles fazem tanto modelos Gemini de código fechado que competem na fronteira, quanto modelos de pesos abertos (Gemma) que qualquer um pode executar. Gemini 3 Pro representa um grande salto em compreensão multimodal através de texto, imagens, áudio e vídeo.


Modelos da xAI

  • Grok 4 (Thinking): O modelo de pensamento principal da xAI, treinado com aprendizado por reforço para usar ferramentas como interpretador de código e navegação web. Primeiro modelo a pontuar 50% no Exame Final da Humanidade.
  • Grok 4 Fast: Versão eficiente em custos com desempenho similar ao Grok 4 mas 40% menos tokens de pensamento e uma janela de contexto de 2 milhões de tokens

xAI e Elon Musk têm uma rivalidade com a OpenAI que está esquentando. Com a xAI comprando X (anteriormente Twitter), eles têm uma fonte única de dados de treinamento como Facebook ou Google têm, e estão investindo rapidamente em GPUs. Grok 4 alcançou pontuações inovadoras no ARC-AGI-2, quase dobrando o estado da arte comercial anterior.


Modelos da Meta

(Meta é dona do Facebook, Instagram, Threads, WhatsApp, Oculus, etc. É como o Google é tecnicamente parte da Alphabet junto com Waymo etc.)

  • Llama 4 Maverick: Melhor contendor libra por libra - rápido, preço razoável, comparável ao DeepSeek V3
  • Llama 3.3 70b: Excelência libra por libra da geração anterior (agora desatualizado mas ainda disponível)

Meta é o porta-estandarte da IA quase-código aberto (há alguns limites em sua licença, mas não significativos a menos que você seja uma empresa de muitos bilhões de dólares).


Modelos da Deepseek

  • Deepseek Chat V3.1 (Thinking): O mais recente modelo de pensamento da DeepSeek com excelentes capacidades de raciocínio. Usamos provedores mais caros que não treinam com a saída, em vez da própria DeepSeek (que treina com sua saída).
  • Deepseek Chat V3.1: Excelente e barato modelo sem pensamento da DeepSeek. Usamos provedores mais caros que não treinam com as saídas, por razões de privacidade.

DeepSeek é um laboratório de IA chinês incrível produzindo modelos excelentes a custos notavelmente baixos. Priorizamos sua privacidade usando provedores que não treinam com suas conversas.


Modelos da Qwen

  • Qwen 3 235b (Thinking): O maior modelo de pensamento da Alibaba com 235 bilhões de parâmetros
  • Qwen 3 235b Instruct: Variante sem pensamento do modelo de 235b

Os modelos Qwen da Alibaba fornecem excelente desempenho em vários tamanhos, com a série Qwen 3 representando seus últimos avanços em modelos de linguagem grandes.


Modelos da MiniMax

  • MiniMax M2: O mais recente modelo principal da MiniMax, um MoE de 230B parâmetros com apenas 10B parâmetros ativos. Construído para desempenho de elite em código e tarefas agênticas. Modelo de pesos abertos com maior pontuação globalmente, seguindo de perto GPT-5 (high) e Grok 4. A apenas 8% do preço do Claude Sonnet e o dobro da velocidade.

MiniMax é uma empresa de IA chinesa apoiada pela Alibaba e Tencent, fazendo modelos excepcionais. M2 alcançou uma pontuação sem precedentes para um modelo aberto em benchmarks de inteligência, superando o Gemini 2.5 Pro do Google DeepMind.


Modelos da Z-AI (Zhipu AI)

  • GLM 4.6 (Thinking): O modelo de pensamento principal da Z-AI com 355B parâmetros (35B ativos), apresentando uma janela de contexto de 200K tokens. Quase paridade com Claude Sonnet 4 em tarefas de código do mundo real enquanto usa ~15% menos tokens.

Z-AI (Zhipu AI) é uma empresa de IA chinesa fazendo modelos de grande valor com forte raciocínio. GLM 4.6 é totalmente de pesos abertos com licença MIT, permitindo que empresas auto-hospedem e personalizem.


Modelos da Moonshot AI

  • Kimi K2 (Thinking): O modelo de pensamento principal da Moonshot, um dos melhores LLMs abertos disponíveis com capacidades agênticas que superam GPT-5 e Claude Sonnet 4.5 em certas tarefas. Pode selecionar automaticamente 200-300 ferramentas para completar tarefas de forma autônoma.
  • Kimi K2 0905: Variante sem pensamento atualizada com desempenho de código melhorado e janela de contexto de 256K tokens, pense no ChatGPT padrão

Kimi K2 da Moonshot AI é um modelo MoE de 1 trilhão de parâmetros (32B ativos) apoiado pela Alibaba. A variante K2 Thinking é atualmente o modelo de pensamento de código aberto mais poderoso disponível.


Modelos de Imagem, Áudio e Vídeo

Usamos uma combinação de modelos que atualizam conforme encontramos novos campeões de preço/desempenho para diferentes aspectos do site. Estes podem incluir:

  • Flux (Kontext, Krea etc.)
  • SeeDance/SeeDream
  • Veo/Imagen
  • GPT-Image
  • Modelos ElevenLabs
  • Modelos de última geração de fala para texto e texto para fala

Estes são atualizados frequentemente, como nossos blends.

Procurando Integrações que não são LLM?


Modelos Aposentados

Estes modelos foram aposentados de nossas ofertas principais. Eles podem ainda estar disponíveis mediante solicitação mas foram substituídos por versões mais novas.

OpenAI: GPT-5, GPT-5 Low/High, GPT-5 Chat, GPT-OSS-20b, o3, o4-mini, GPT-4.1 Mini, GPT-4.1 Nano, GPT-4o mini, GPT-3.5 Turbo

Anthropic: Claude Opus 4 / Sonnet 4, Claude 3.5 Haiku

Google: Gemini 2.5 Pro (Thinking), Gemini 2.0 Flash Lite

Meta: Llama 4 Scout, Llama 3.1 8b, Llama 3.1 405b

xAI: Grok 3 Mini (Thinking)

Qwen: Qwen 3 32b (Thinking), Qwen 3 30b MoE

Deepseek: Deepseek Chat V3, Deepseek R1

Z-AI: GLM 4.5 / GLM 4.5 Air

MiniMax: MiniMax-01

Mistral AI: Mistral Small V3.2

Cohere: Command-A

Ready For DatBot?

Use Gemini 2.5 Pro, Llama 4, DeepSeek R1, Claude 4, O3 and more in one place, and save time with dynamic prompts and automated workflows.

Top Articles

Come on in, the water's warm

See how much time DatBot.AI can save you