Introdução
Sou muito interessado em avanços de aprendizado de máquina de todos os tipos, e acompanho pesquisas de todo o planeta.
Vi um artigo que achei fascinante, [https://arxiv.org/abs/2401.02994]Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM (2024).
Este artigo em particular veio das mentes férteis da Universidade de Cambridge, University College London, e uma equipe divertida chamada Chai Research.
O que eles descobriram, essencialmente, através de testes reais com usuários (não apenas teoria)…
Usuários se engajaram mais e tiveram maiores taxas de retenção quando conversaram com uma mistura de modelos de linguagem grandes de baixo custo, variando de 6 bilhões a 13 bilhões de parâmetros…
…versus ChatGPT 3.5…
Que usa 175 bilhões de parâmetros.
Isso é uma mistura de modelos até 30 vezes menores…
Obtendo um resultado melhor, para a maioria dos usuários do produto deles.
Eu levo esse conceito no BrightRobot para o próximo nível - os modelos que combino para cada uma das minhas misturas incluem até a versão mais nova e de melhor desempenho do GPT-4, GPT-4o, que dominou a LMSYS Chatbot Arena quando era pré-lançamento sob ‘im-a-good-gpt2-chatbot’.
Até mesmo a mistura Instant que temos como nossa mistura mais básica é uma combinação onde cada modelo é mais forte que o ChatGPT 3.5… isoladamente, enquanto também é muito mais rápido.
…E é isso que estou disponibilizando gratuitamente.
O que temos na mistura Fast HQ é tudo pelo menos comparável ao GPT-4, e tudo na nossa mistura HQ é muito mais forte, e ainda inclui a iteração mais nova do próprio GPT-4, o GPT-4o.
O que isso significa para você?
Significa melhores respostas, um companheiro de chat mais envolvente, e respostas mais variadas e interessantes.
Também significa respostas mais rápidas, o que é muito importante para mim, já que me economiza tempo para trabalhar em coisas mais importantes.
Em outras palavras - as misturas fazem mais por mim, e por você, mais rápido.
Legal? Eu achei, então espero que você também ache.
E lembre-se, se esse “Blend” parece muito louco para você, basta escolher seu modelo preferido (de muitas empresas - OpenAI, Anthropic, Cohere, Mistral AI, e muitas mais) e seguir seu dia.
Até onde eu sei, esta é a primeira implementação que combina o que é chamado de “modelos de fronteira”, ou seja… modelos realmente poderosos… automaticamente, para te dar um resultado melhor.
Espero que isso seja copiado por outras interfaces em breve, porque…
Bem, é simplesmente melhor.
E não queremos todos o melhor, onde pudermos conseguir?
Me mande um e-mail para [email protected] com seu feedback enquanto os usa, adoraria saber o que você pensa.