MoonshotAI har gitt ut Kimi K2 Thinking, en ny resonneringsvariant av Kimi K2 som oppnår #1 i Tau2 Bench Telecom agentic benchmark og er potensielt den nye ledende modellen med åpne vekter Kimi K2 Thinking er en av de største åpne vektmodellene noensinne, med 1T totale parametere med 32B aktiv. K2 Thinking er den første resonnerende modellutgivelsen i @Kimi_Moonshot Kimi K2-modellfamilie, etter ikke-resonnerende Kimi K2 Instruct-modeller utgitt tidligere i juli og september 2025. Viktige takeaways: ➤ Sterk ytelse på agentiske oppgaver: Kimi K2 Thinking oppnår 93 % i τ²-Bench Telecom, en referanse for bruk av agentverktøy der modellen fungerer som en kundeserviceagent. Dette er den høyeste poengsummen vi uavhengig har målt. Verktøybruk i agentiske sammenhenger med lang horisont var en styrke for Kimi K2 Instruct, og det ser ut til at denne nye Thinking-varianten gir betydelige gevinster ➤ Resonnerende variant av Kimi K2 Instruct: Modellen, i henhold til navnet, er en resonnerende variant av Kimi K2 Instruct. Modellen har samme arkitektur og samme antall parametere (men forskjellig presisjon) som Kimi K2 Instruct og støtter i likhet med K2 Instruct bare tekst som en inn- og utdatamodalitet ➤ 1T-parametere, men INT4 i stedet for FP8: I motsetning til Moonshots tidligere Kimi K2 Instruct-utgivelser som brukte FP8-presisjon, har denne modellen blitt utgitt i INT4-presisjon. Moonshot brukte kvantiseringsbevisst trening i fasen etter trening for å oppnå dette. Virkningen av dette er at K2 Thinking bare er ~594 GB, sammenlignet med litt over 1 TB for K2 Instruct og K2 Instruct 0905 - noe som gir effektivitetsgevinster for inferens og trening. En potensiell årsak til INT4 er at NVIDIA-GPUer før Blackwell ikke har støtte for FP4, noe som gjør INT4 mer egnet for å oppnå effektivitetsgevinster på tidligere maskinvare. Vårt komplette sett med Artificial Analysis Intelligence Index-referanser er under utvikling, og vi vil gi en oppdatering så snart de er fullført.