Remarquable. La Chine encore…
Artificial Analysis
Artificial Analysis7 nov., 05:10
MoonshotAI a lancé Kimi K2 Thinking, une nouvelle variante de raisonnement de Kimi K2 qui atteint la #1 dans le benchmark agentique Tau2 Bench Telecom et est potentiellement le nouveau modèle à poids ouverts leader. Kimi K2 Thinking est l'un des plus grands modèles à poids ouverts jamais créés, avec 1T de paramètres au total et 32B actifs. K2 Thinking est le premier modèle de raisonnement publié au sein de la famille de modèles Kimi K2 de @Kimi_Moonshot, après les modèles Kimi K2 Instruct non raisonneurs publiés précédemment en juillet et septembre 2025. Points clés : ➤ Excellente performance sur les tâches agentiques : Kimi K2 Thinking atteint 93 % dans 𝜏²-Bench Telecom, un benchmark d'utilisation d'outils agentiques où le modèle agit en tant qu'agent de service client. C'est le score le plus élevé que nous avons mesuré de manière indépendante. L'utilisation d'outils dans des contextes agentiques à long terme était un point fort de Kimi K2 Instruct et il semble que cette nouvelle variante Thinking réalise des gains substantiels. ➤ Variante de raisonnement de Kimi K2 Instruct : Le modèle, comme son nom l'indique, est une variante de raisonnement de Kimi K2 Instruct. Le modèle a la même architecture et le même nombre de paramètres (bien que de précision différente) que Kimi K2 Instruct et, comme K2 Instruct, ne prend en charge que le texte comme modalité d'entrée (et de sortie). ➤ 1T de paramètres mais INT4 au lieu de FP8 : Contrairement aux précédentes versions Kimi K2 Instruct de Moonshot qui utilisaient la précision FP8, ce modèle a été publié nativement en précision INT4. Moonshot a utilisé un entraînement conscient de la quantification dans la phase post-formation pour y parvenir. L'impact de cela est que K2 Thinking ne pèse que ~594 Go, contre un peu plus de 1 To pour K2 Instruct et K2 Instruct 0905 - ce qui se traduit par des gains d'efficacité pour l'inférence et la formation. Une raison potentielle pour INT4 est que les GPU NVIDIA pré-Blackwell ne prennent pas en charge FP4, rendant INT4 plus adapté pour réaliser des gains d'efficacité sur le matériel plus ancien. Notre ensemble complet de benchmarks de l'Indice d'Analyse d'Intelligence Artificielle est en cours et nous fournirons une mise à jour dès qu'ils seront complets.
Principaux investisseurs dans @Kimi_Moonshot : Alibaba (propriétaire à 40 %), Tencent, Meituan, Ant Group, Hongshan … et Microsoft ont participé !
3,6K