MoonshotAI on julkaissut Kimi K2 Thinkingin, Kimi K2:n uuden päättelymuunnelman, joka saavuttaa #1 Tau2 Bench Telecomin agenttivertailussa ja on mahdollisesti uusi johtava avopainomalli Kimi K2 Thinking on yksi kaikkien aikojen suurimmista avoimista painomalleista, 1T:n kokonaisparametreilla ja 32B aktiivisena. K2 Thinking on ensimmäinen päättelymallijulkaisu @Kimi_Moonshot:n Kimi K2 -malliperheessä aiemmin heinä- ja syyskuussa 2025 julkaistujen ei-järkeilevien Kimi K2 Instruct -mallien jälkeen. Tärkeimmät huomiot: ➤ Vahva suorituskyky agenttitehtävissä: Kimi K2 Thinking saavuttaa 93 % τ²-Bench Telecomissa, agenttityökalujen käytön vertailukohdassa, jossa malli toimii asiakaspalvelijana. Tämä on korkein pistemäärä, jonka olemme riippumattomasti mitanneet. Työkalujen käyttö pitkän aikavälin agenttiyhteyksissä oli Kimi K2 Instructin vahvuus, ja näyttää siltä, että tämä uusi ajattelumuunnelma tuo merkittäviä etuja ➤ Kimi K2 Instructin päättelyvaihtoehto: Malli on nimensä mukaan Kimi K2 Instructin päättelyvaihtoehto. Mallilla on sama arkkitehtuuri ja sama määrä parametreja (vaikkakin eri tarkkuus) kuin Kimi K2 Instructilla, ja kuten K2 Instructilla, se tukee vain tekstiä syöte- (ja tulostusmodaliteettina) ➤ 1T-parametrit, mutta INT4 FP8:n sijaan: Toisin kuin Moonshotin aiemmat Kimi K2 Instruct -julkaisut, jotka käyttivät FP8-tarkkuutta, tämä malli on julkaistu natiivisti INT4-tarkkuudella. Moonshot käytti kvantisointitietoista koulutusta koulutuksen jälkeisessä vaiheessa saavuttaakseen tämän. Tämän vaikutus on, että K2 Thinking on vain ~594 Gt, kun taas K2 Instructin ja K2 Instruct 0905:n hieman yli 2 Tt - mikä tarkoittaa tehokkuuden hyötyjä päättelyssä ja koulutuksessa. Mahdollinen syy INT4:ään on se, että Blackwellia edeltävillä NVIDIA-grafiikkasuorittimilla ei ole tukea FP4:lle, mikä tekee INT4:stä sopivamman tehokkuuden parantamiseen aikaisemmilla laitteilla. Tekoälyanalyysin älykkyysindeksin koko vertailuarvo on käynnissä, ja annamme päivityksen heti, kun ne ovat valmiit.