DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

MoonshotAI a lansat Kimi K2 Thinking, o nouă variantă de raționament a Kimi K2 care atinge locul #1 în benchmark-ul agentic Tau2 Bench Telecom și este potențial noul model de greutăți deschise Kimi K2 Thinking este unul dintre cele mai mari modele cu greutăți deschise vreodată, la 1T parametri totali cu 32B activi. K2 Thinking este prima lansare de model de raționament din familia de modele Kimi K2 de la @Kimi_Moonshot, după modelele Kimi K2 Instruct fără raționament lansate anterior în iulie și septembrie 2025. Concluzii cheie: ➤ Performanță puternică la sarcinile agentice: Kimi K2 Thinking atinge 93% în τ²-Bench Telecom, un benchmark de utilizare a instrumentelor agentice în care modelul acționează ca un agent de servicii pentru clienți. Acesta este cel mai mare scor pe care l-am măsurat independent. Utilizarea instrumentelor în contexte agentice cu orizont lung a fost un punct forte al Kimi K2 Instruct și se pare că această nouă variantă Thinking face câștiguri substanțiale ➤ Varianta de raționament a Kimi K2 Instruct: Modelul, conform denumirii sale, este o variantă de raționament a Kimi K2 Instruct. Modelul are aceeași arhitectură și același număr de parametri (deși precizie diferită) ca Kimi K2 Instruct și, la fel ca K2 Instruct, acceptă doar text ca modalitate de intrare (și ieșire) ➤ Parametrii 1T, dar INT4 în loc de FP8: Spre deosebire de versiunile anterioare Kimi K2 Instruct de la Moonshot care foloseau precizia FP8, acest model a fost lansat nativ în precizie INT4. Moonshot a folosit antrenamentul conștient de cuantificare în faza post-antrenament pentru a realiza acest lucru. Impactul acestui lucru este că K2 Thinking are doar ~ 594 GB, comparativ cu puțin peste 1 TB pentru K2 Instruct și K2 Instruct 0905 - ceea ce se traduce prin câștiguri de eficiență pentru inferență și antrenament. Un motiv potențial pentru INT4 este că GPU-urile NVIDIA pre-Blackwell nu au suport pentru FP4, ceea ce face ca INT4 să fie mai potrivit pentru a obține câștiguri de eficiență pe hardware-ul anterior. Setul nostru complet de benchmark-uri Artificial Analysis Intelligence Index este în curs de desfășurare și vom oferi o actualizare de îndată ce vor fi finalizate.

Limită superioară

Clasament

Favorite