Удивительно. Китай снова...
Artificial Analysis
Artificial Analysis7 нояб., 05:10
MoonshotAI выпустила Kimi K2 Thinking, новый вариант рассуждений Kimi K2, который занимает 1-е место в бенчмарке Tau2 Bench Telecom для агентных задач и потенциально является новой ведущей моделью с открытыми весами. Kimi K2 Thinking — одна из крупнейших моделей с открытыми весами, с 1 триллионом параметров и 32 миллиардами активных. K2 Thinking — это первая модель рассуждений в семействе моделей Kimi K2 от @Kimi_Moonshot, после ранее выпущенных моделей Kimi K2 Instruct без рассуждений в июле и сентябре 2025 года. Ключевые выводы: ➤ Высокая производительность в агентных задачах: Kimi K2 Thinking достигает 93% в 𝜏²-Bench Telecom, бенчмарке использования инструментов, где модель выступает в роли агента службы поддержки. Это самый высокий результат, который мы измеряли независимо. Использование инструментов в долгосрочных агентных контекстах было сильной стороной Kimi K2 Instruct, и, похоже, этот новый вариант Thinking делает значительные успехи. ➤ Вариант рассуждений Kimi K2 Instruct: Модель, согласно своему названию, является вариантом рассуждений Kimi K2 Instruct. Модель имеет ту же архитектуру и то же количество параметров (хотя с другой точностью), что и Kimi K2 Instruct, и, как и K2 Instruct, поддерживает только текстовый ввод (и вывод). ➤ 1 триллион параметров, но INT4 вместо FP8: В отличие от предыдущих выпусков Kimi K2 Instruct от Moonshot, которые использовали точность FP8, эта модель была выпущена в родной точности INT4. Moonshot использовал обучение с учетом квантования на этапе постобучения, чтобы достичь этого. Влияние этого заключается в том, что K2 Thinking занимает всего ~594 ГБ, по сравнению с чуть более 1 ТБ для K2 Instruct и K2 Instruct 0905 — что приводит к повышению эффективности для вывода и обучения. Потенциальная причина использования INT4 заключается в том, что графические процессоры NVIDIA до Blackwell не поддерживают FP4, что делает INT4 более подходящим для достижения повышения эффективности на более раннем оборудовании. Наш полный набор бенчмарков Artificial Analysis Intelligence Index в процессе, и мы предоставим обновление, как только они будут завершены.
Крупные инвесторы в @Kimi_Moonshot : Alibaba (владелец 40%), Tencent, Meituan, Ant Group, Hongshan … и Microsoft также приняли участие!
3,6K