一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

驚人。中國又來了…

MoonshotAI 發布了 Kimi K2 Thinking，這是一種新的推理變體，Kimi K2 在 Tau2 Bench Telecom 代理基準中達到第 #1 名，並且可能成為新的領先開放權重模型。 Kimi K2 Thinking 是有史以來最大的開放權重模型之一，擁有 1T 的總參數和 32B 的活躍參數。K2 Thinking 是 @Kimi_Moonshot 的 Kimi K2 模型系列中首個推理模型，繼之前於 2025 年 7 月和 9 月發布的非推理 Kimi K2 Instruct 模型之後。關鍵要點： ➤ 在代理任務上的強勁表現：Kimi K2 Thinking 在 𝜏²-Bench Telecom 中達到 93%，這是一個代理工具使用基準，模型作為客戶服務代理。這是我們獨立測量的最高分數。Kimi K2 Instruct 在長期代理上下文中的工具使用是一個優勢，這個新的 Thinking 變體似乎取得了實質性的進展。 ➤ Kimi K2 Instruct 的推理變體：該模型，根據其命名，是 Kimi K2 Instruct 的推理變體。該模型具有與 Kimi K2 Instruct 相同的架構和相同數量的參數（雖然精度不同），並且像 K2 Instruct 一樣僅支持文本作為輸入（和輸出）模態。 ➤ 1T 參數但使用 INT4 而非 FP8：與 Moonshot 之前的 Kimi K2 Instruct 發布使用 FP8 精度不同，這個模型是以 INT4 精度原生發布的。Moonshot 在後訓練階段使用了量化感知訓練來實現這一點。這樣的影響是 K2 Thinking 僅約 594GB，相較於 K2 Instruct 和 K2 Instruct 0905 的 1TB 多一點 - 這轉化為推理和訓練的效率提升。INT4 的潛在原因是，早期的 Blackwell NVIDIA GPU 不支持 FP4，使得 INT4 更適合在早期硬體上實現效率提升。我們的完整人工分析智能指數基準正在進行中，並將在完成後提供更新。

@Kimi_Moonshot 的主要投資者：阿里巴巴（40% 的擁有者）、騰訊、美團、螞蟻集團、紅杉 … 還有微軟參與！

3.56K