A Mistral acaba de lançar seu novo modelo de grandes volumes abertos, Mistral Large 3 (675B no total, 41B ativos), junto com um conjunto de três modelos Ministral (3B, 8B, 14B) A Mistral lançou variantes Instruct (não raciocíniosas) dos quatro modelos, assim como variantes de raciocínio dos três modelos Ministerial. Todos os modelos suportam entradas multimodais e estão disponíveis com uma licença Apache 2.0 hoje em @huggingface. Avaliamos o Mistral Large 3 e as variantes Instruct dos três modelos Ministral antes do lançamento. O modelo de maior pontuação do Mistral no Índice de Inteligência de Análise Artificial continua sendo o proprietário Magistral Medium 1.2, lançado há alguns meses em setembro – isso se deve ao raciocínio que dá aos modelos uma vantagem significativa em muitas avaliações que utilizamos. Mistral revela que uma versão de raciocínio do Mistral Large 3 já está em treinamento e estamos ansiosos para avaliá-la em breve! Destaques principais: ➤ Modelos grandes e pequenos: com 675B no total e 41B ativos, o Mistral Large 3 é o primeiro modelo de peso aberto misturado de especialistas da Mistral desde o Mixtral 8x7B e 8x22B do final de 2023 ao início de 2024. As versões Ministral são densas com variantes dos parâmetros 3B, 8B e 14B ➤ Aumento significativo de inteligência, mas não entre os principais modelos (incluindo proprietários): Mistral Large 3 representa uma melhoria significativa em comparação com o anterior Mistral Large 2, com um aumento de +11 pontos no Índice de Inteligência até 38. No entanto, o Large 3 ainda fica atrás dos principais modelos proprietários de raciocínio e não-raciocínio ➤ Modelos pequenos versáteis: os modelos Ministral são lançados com pesos variantes Base, Instruct e Reasoning - testamos apenas as variantes Instruct antes do lançamento, que alcançaram pontuações Index de 31 (14B), 28 (8B) e 22 (3B). Isso coloca a Ministral 14B à frente da anterior Mistral Small 3.2, com 40% menos parâmetros. Estamos trabalhando na avaliação das variantes de raciocínio e compartilharemos em breve seus resultados de inteligência. ➤ Capacidades multimodais: todos os modelos da versão suportam entradas de texto e imagem – isso é um diferencial significativo para o Mistral Large 3, já que poucos modelos de peso aberto em sua classe de tamanho suportam entrada de imagem. O comprimento do contexto também aumenta para 256k, permitindo tarefas de entrada maior. Esses novos modelos da Mistral não representam uma mudança em relação à competição de pesos abertos, mas representam uma base sólida de desempenho com capacidades de visão. As variantes Ministral 8B e 14B oferecem desempenho particularmente atraente para seu tamanho, e estamos animados para ver como a comunidade usa e desenvolve esses modelos. No lançamento, os novos modelos estão disponíveis para inferência serverless na @MistralAI e em diversos outros provedores, incluindo @awscloud Bedrock, @Azure AI Foundry, @IBMwatsonx, @FireworksAI_HQ, @togethercompute e @modal.
Mistral Large 3 segue a fronteira, mas notavelmente é um dos modelos multimodais não raciocínios mais inteligentes de peso aberto. Modelos recentes da DeepSeek (v3.2) e Moonshot (Kimi K2) continuam a suportar apenas entrada e saída de texto.
Devido ao seu pequeno tamanho, as versões Ministral apresentam um sólido equilíbrio entre inteligência e custo, completando as avaliações do Índice a um custo substancialmente menor do que modelos comparáveis, como modelos pequenos da família Qwen3 – particularmente as variantes VL que suportam entradas de imagem como a Ministral.
Os modelos ministeriais são especialmente diferenciados para tarefas que exigem entradas de imagem e para um modelo não raciocínio. Os três tamanhos representam uma evolução significativa em relação à família Gemma 3 do Google (anteriormente uma opção de referência para modelos multimodais pequenos) e são competitivos com os recentes lançamentos Qwen3 VL da Alibaba.
Magistral Medium 1.2 permanece como o modelo líder geral do Mistral em Índice de Inteligência em Análise Artificial.
Para análises mais aprofundadas desses novos modelos e dos fornecedores deles à medida que surgem, veja nossas páginas de modelos sobre Análise Artificial: Mistral Grande 3: Ministral 14B: Ministro 8B:
14,74K