Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mistral tocmai a lansat noul lor model mare cu greutăți deschise, Mistral Large 3 (675 miliarde în total, 41 miliarde active), alături de un set de trei modele Ministral (3B, 8B, 14B)
Mistral a lansat variante Instruct (non-raționament) pentru toate cele patru modele, precum și variante de raționament ale celor trei modele Minister. Toate modelele suportă intrări multimodale și sunt disponibile astăzi cu o licență Apache 2.0 pe @huggingface. Am evaluat Mistral Large 3 și variantele Instruct ale celor trei modele Ministral înainte de lansare.
Modelul cu cel mai mare scor al Mistral în Artificial Analysis Intelligence Index rămâne proprietarul Magistral Medium 1.2, lansat cu câteva luni în urmă în septembrie – acest lucru se datorează raționamentului care oferă modelelor un avantaj semnificativ în multe dintre evaluările pe care le folosim. Mistral dezvăluie că o versiune de raționament a Mistral Large 3 este deja în curs de antrenament și așteptăm cu nerăbdare să o evaluăm în curând!
Aspecte importante:
➤ Modele mari și mici: cu un total de 675B și 41B active, Mistral Large 3 este primul model mixt de experți cu greutăți deschise de la Mistral 8x7B și 8x22B de la sfârșitul anului 2023 până la începutul lui 2024. Versiunile Ministral sunt dense cu variante de parametri 3B, 8B și 14B
➤ Creștere semnificativă a inteligenței, dar nu și printre modelele de top (inclusiv cele proprietare): Mistral Large 3 reprezintă o îmbunătățire semnificativă față de precedentul Mistral Large 2, cu o creștere de +11 puncte a Indicelui de Inteligență până la 38. Totuși, Large 3 rămâne în urma modelelor de raționament proprietar și non-raționament care conduc
➤ Modele mici versatile: modelele Ministral sunt lansate cu greutăți variante Base, Instruct și Reasoning - am testat doar variantele Instruct înainte de lansare, care au obținut scoruri Index de 31 (14B), 28 (8B) și 22 (3B). Aceasta plasează Ministral 14B înaintea anterioarei Mistral Small 3.2, cu 40% mai puțini parametri. Lucrăm la evaluarea variantelor de raționament și vom împărtăși în curând rezultatele lor de inteligență.
➤ Capabilități multi-modale: toate modelele din lansare suportă intrări de text și imagini – acesta este un diferențiator semnificativ pentru Mistral Large 3, deoarece puține modele open weight din clasa sa de dimensiuni au suport pentru intrarea de imagine. Lungimea contextului crește, de asemenea, la 256k, permițând sarcini cu input mai mare.
Aceste modele noi de la Mistral nu reprezintă o schimbare radicală față de competiția cu greutăți deschise, dar reprezintă o bază solidă de performanță cu capabilități de vedere. Variantele Ministral 8B și 14B oferă performanțe deosebit de atractive pentru dimensiunea lor, iar noi suntem nerăbdători să vedem cum va folosi și construi comunitatea aceste modele.
La lansare, noile modele sunt disponibile pentru inferență serverless pe @MistralAI și pe o gamă largă de alți furnizori, inclusiv @awscloud Bedrock, @Azure AI Foundry, @IBMwatsonx, @FireworksAI_HQ, @togethercompute și @modal.

Mistral Large 3 rămâne la frontieră, dar este notabil unul dintre cele mai inteligente modele multimodale non-raționalizante pentru greutăți deschise. Modelele recente de la DeepSeek (v3.2) și Moonshot (Kimi K2) continuă să suporte doar intrare și ieșire text.

Datorită dimensiunii lor mici, versiunile Ministral arată un compromis solid între inteligență și cost, completând evaluările Index la un cost semnificativ mai mic decât modelele comparabile, cum ar fi modelele mici din familia Qwen3 – în special variantele VL care suportă intrări de imagine precum Ministral.

Modelele ministeriale sunt deosebit de diferențiate pentru sarcinile care necesită intrări de imagine și pentru un model fără raționament. Toate cele trei dimensiuni reprezintă o îmbunătățire semnificativă față de familia Gemma 3 de la Google (care anterior era o opțiune preferată pentru modelele multimodale mici) și sunt competitive cu lansările recente Qwen3 VL ale Alibaba.

Magistral Medium 1.2 rămâne modelul de top al Mistral în Artificial Analysis Inteligence Index.

Pentru o analiză suplimentară a acestor noi modele și a furnizorilor pentru ele pe măsură ce apar, consultați paginile noastre de modele despre Analiza Artificială:
Mistral Large 3:
Ministral 14B:
Ministral 8B:
14,73K
Limită superioară
Clasament
Favorite

