Blend di DatBot
- Fast Blend: Un mix di modelli incredibili che dai nostri partner restituiscono >200 token al secondo come minimo, puntando a una qualità a livello di ChatGPT.
- HQ Blend: Il nostro blend più lento, ma di qualità incredibilmente alta, che include alcuni dei migliori modelli disponibili in ogni momento.
- Thinking Blend: Modelli con ragionamento di alta qualità da diversi laboratori “di frontiera”, per far collaborare architetture diverse sulle tue risposte.
- Cascade (Cascata di prospettive): Più modelli che esplorano prospettive diverse, sintetizzando un output finale più prezioso di quello che potrebbe produrre un singolo modello.
- DB-1 (Ragionamento profondo): Ragionamento a risposta lunga: capace di affrontare progetti più estesi con esigenze più complesse.
- DB-1 Flash (Ragionamento profondo Flash): Versione fulminea di Deep Reasoning: abbina ragionamento a risposta lunga e prontezza.
I Blend di DatBot e la Cascata di prospettive sono, per quanto ne so, la prima volta che modelli “di frontiera” sono stati messi in una capacità di generazione “a blend” per migliorarne le prestazioni. Puoi leggere di più in questo post di DatBot sui blend. Niente origine unica qui!
Deep Reasoning e Deep Reasoning Flash sono stati tra i primi veri successi nel generare risposte lunghe più solide: ora i modelli con ragionamento stanno migliorando su questo in modo nativo, e qui i modelli migliori fanno ancora un salto di livello.
Modelli OpenAI
Modelli con ragionamento:
- GPT-5.1: L’ultimo e più avanzato modello con ragionamento di OpenAI, con ragionamento adattivo che regola dinamicamente il tempo di riflessione in base alla complessità del compito
- GPT-5.1 Codex: Modello con ragionamento a piena scala, orientato al codice e addestrato nativamente per flussi di lavoro agentici di programmazione
- GPT-5.1 Codex Mini: Versione più piccola e più veloce di GPT-5.1, orientata al codice
- GPT-5.1 Low: Variante a basso impegno di ragionamento per risposte più rapide
- GPT-5.1 High: Variante ad alto impegno di ragionamento per problemi complessi
- GPT-OSS-120b: Modello con ragionamento open source di OpenAI con 120 miliardi di parametri
- GPT-5 Mini: Versione più piccola e più veloce di GPT-5
- GPT-5 Nano: La variante più piccola di GPT-5, ottima per compiti semplici
Modelli senza ragionamento:
- GPT-5.1 Chat (ChatGPT Version): Variante senza ragionamento di GPT-5.1, esattamente uguale a ChatGPT
- GPT-4o: Il modello che ChatGPT usava prima (ormai superato: usa GPT-5.1 Chat invece)
I modelli di OpenAI sono all’avanguardia estrema della tecnologia IA, e spingono i limiti di ciò che l’IA può fare. Hanno dimostrato cosa è possibile. In stretta partnership con Microsoft.
Modelli Anthropic
Modelli con ragionamento:
- Claude Opus 4.5 (Thinking): Il modello più avanzato di Claude, con capacità di pensiero/ragionamento
- Claude Sonnet 4.5 (Thinking): Sonnet 4.5 con capacità di pensiero per ragionamenti complessi
- Claude Haiku 4.5 (Thinking): Modello con ragionamento fulmineo: offre prestazioni di programmazione simili a Claude Sonnet 4 a un terzo del costo e a più del doppio della velocità
Modelli senza ragionamento:
- Claude Opus 4.5: Variante senza ragionamento, eccellente per scrittura creativa
- Claude Sonnet 4.5: Variante senza ragionamento, eccellente per programmazione e compiti generici
I modelli “Sonnet” tendono a essere i migliori per rapporto prezzo/prestazioni: Sonnet 4.5 è un modello di programmazione pazzesco, per esempio (lo uso continuamente). Opus spesso è il miglior scrittore, a qualunque prezzo. Haiku 4.5 ora offre capacità notevoli a una velocità bruciante: solo sei mesi fa, questo livello di prestazioni sarebbe stato lo stato dell’arte.
Modelli Google
Modelli con ragionamento:
- Gemini 3 Pro (Thinking): Il modello di ragionamento più avanzato di Google, con oltre il 50% di miglioramento nelle attività di benchmark risolte rispetto a Gemini 2.5 Pro, con una finestra di contesto da 1M token
- Gemini 2.5 Flash (Thinking): Modello con ragionamento ad alta velocità di Google
Modelli senza ragionamento:
- Gemini 2.5 Flash: Il miglior modello ad alta velocità di Google senza ragionamento
- Gemini 2.0 Flash: Ottimo rapporto prezzo/prestazioni
Google è… be’, Google. Fanno sia modelli Gemini closed source che competono sulla frontiera, sia modelli open weight (Gemma) che chiunque può eseguire. Gemini 3 Pro rappresenta un grande salto nella comprensione multimodale tra testo, immagini, audio e video.
Modelli xAI
- Grok 4 (Thinking): Il modello con ragionamento di punta di xAI, addestrato con apprendimento per rinforzo per usare strumenti come interprete di codice e navigazione web. Primo modello a raggiungere il 50% su Humanity’s Last Exam.
- Grok 4 Fast: Versione più conveniente con prestazioni simili a Grok 4 ma con il 40% di token di ragionamento in meno e una finestra di contesto da 2 milioni di token
xAI ed Elon Musk hanno una rivalità con OpenAI che si sta scaldando. Con xAI che compra X (ex Twitter), hanno una fonte unica di dati di addestramento come hanno Facebook o Google, e stanno investendo rapidamente in GPU. Grok 4 ha ottenuto punteggi rivoluzionari su ARC-AGI-2, quasi raddoppiando lo stato dell’arte commerciale precedente.
Modelli Meta
(Meta possiede Facebook, Instagram, Threads, WhatsApp, Oculus, ecc. È un po’ come dire che Google, tecnicamente, fa parte di Alphabet insieme a Waymo, ecc.)
- Llama 4 Maverick: Miglior contendente euro per euro: veloce, a prezzo ragionevole, paragonabile a DeepSeek V3
- Llama 3.3 70b: Eccellenza euro per euro della generazione precedente (ormai superato, ma ancora disponibile)
Meta è il portabandiera dell’IA quasi open source (ci sono alcuni limiti nella licenza, ma non sono rilevanti a meno che tu non sia un’azienda da molti miliardi).
Modelli Deepseek
- Deepseek Chat V3.1 (Thinking): L’ultimo modello con ragionamento di DeepSeek, con ottime capacità di ragionamento. Usiamo fornitori più costosi che non si addestrano sugli output, invece di DeepSeek stesso (che invece si addestra sui tuoi output).
- Deepseek Chat V3.1: Ottimo ed economico modello senza ragionamento di DeepSeek. Usiamo fornitori più costosi che non si addestrano sugli output, per motivi di privacy.
DeepSeek è un incredibile laboratorio cinese di IA che produce modelli eccellenti a costi sorprendentemente bassi. Diamo priorità alla tua privacy usando fornitori che non si addestrano sulle tue conversazioni.
Modelli Qwen
- Qwen 3 235b (Thinking): Il più grande modello con ragionamento di Alibaba, con 235 miliardi di parametri
- Qwen 3 235b Instruct: Variante senza ragionamento del modello da 235b
I modelli Qwen di Alibaba offrono prestazioni eccellenti su varie dimensioni, e la serie Qwen 3 rappresenta i loro ultimi progressi nei grandi modelli linguistici.
Modelli MiniMax
- MiniMax M2: Il più recente modello di punta di MiniMax: un MoE da 230B parametri con soli 10B parametri attivi. Costruito per prestazioni d’élite in programmazione e compiti agentici. Il modello open-weight con il punteggio più alto al mondo, appena dietro GPT-5 (high) e Grok 4. A solo l’8% del prezzo di Claude Sonnet e al doppio della velocità.
MiniMax è un’azienda cinese di IA supportata da Alibaba e Tencent, e produce modelli eccezionali. M2 ha ottenuto un punteggio senza precedenti, per un modello open, nei benchmark di intelligenza, superando il Gemini 2.5 Pro di Google DeepMind.
Modelli Z-AI (Zhipu AI)
- GLM 4.6 (Thinking): Il modello con ragionamento di punta di Z-AI con 355B parametri (35B attivi), con una finestra di contesto da 200K token. Quasi alla pari con Claude Sonnet 4 in compiti di programmazione reali, usando ~15% di token in meno.
Z-AI (Zhipu AI) è un’azienda cinese di IA che realizza modelli di grande valore con ragionamento forte. GLM 4.6 è completamente open-weight con licenza MIT, consentendo alle aziende di ospitarlo internamente e personalizzarlo.
Modelli Moonshot AI
- Kimi K2 (Thinking): Il modello con ragionamento di punta di Moonshot, uno dei migliori LLM open disponibili con capacità agentiche che battono GPT-5 e Claude Sonnet 4.5 in certi compiti. Può selezionare automaticamente 200-300 strumenti per completare compiti in autonomia.
- Kimi K2 0905: Variante aggiornata senza ragionamento, con prestazioni di programmazione migliori e finestra di contesto da 256K token: pensa all’impostazione predefinita di ChatGPT
Il Kimi K2 di Moonshot AI è un modello MoE da 1 trilione di parametri (32B attivi) supportato da Alibaba. La variante K2 Thinking è attualmente il modello open source con ragionamento più potente disponibile.
Modelli di immagini, audio e video
Usiamo una combinazione di modelli che aggiorniamo man mano che troviamo nuovi campioni di rapporto prezzo/prestazioni per diversi aspetti del sito. Possono includere:
- Flux (Kontext, Krea ecc.)
- SeeDance/SeeDream
- Veo/Imagen
- GPT-Image
- ElevenLabs models
- Current state of the art speech-to-text and text-to-speech models
Si aggiornano spesso, come i nostri blend.
Cerchi integrazioni non-LLM?
- Abbiamo uno strumento integrato per fare scraping del web e può estrarre qualsiasi sito che vuoi, sia tramite la nostra implementazione della mappa della conoscenza per il RAG sia tramite la nostra interfaccia di chat.
Modelli ritirati
Questi modelli sono stati ritirati dalla nostra offerta principale. Possono ancora essere disponibili su richiesta, ma sono stati superati da versioni più nuove.
OpenAI: GPT-5, GPT-5 Low/High, GPT-5 Chat, GPT-OSS-20b, o3, o4-mini, GPT-4.1 Mini, GPT-4.1 Nano, GPT-4o mini, GPT-3.5 Turbo
Anthropic: Claude Opus 4 / Sonnet 4, Claude 3.5 Haiku
Google: Gemini 2.5 Pro (Thinking), Gemini 2.0 Flash Lite
Meta: Llama 4 Scout, Llama 3.1 8b, Llama 3.1 405b
xAI: Grok 3 Mini (Thinking)
Qwen: Qwen 3 32b (Thinking), Qwen 3 30b MoE
Deepseek: Deepseek Chat V3, Deepseek R1
Z-AI: GLM 4.5 / GLM 4.5 Air
MiniMax: MiniMax-01
Mistral AI: Mistral Small V3.2
Cohere: Command-A