熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
驚人。中國又來了…

11月7日 05:10
MoonshotAI 發布了 Kimi K2 Thinking,這是一種新的推理變體,Kimi K2 在 Tau2 Bench Telecom 代理基準中達到第 #1 名,並且可能成為新的領先開放權重模型。
Kimi K2 Thinking 是有史以來最大的開放權重模型之一,擁有 1T 的總參數和 32B 的活躍參數。K2 Thinking 是 @Kimi_Moonshot 的 Kimi K2 模型系列中首個推理模型,繼之前於 2025 年 7 月和 9 月發布的非推理 Kimi K2 Instruct 模型之後。
關鍵要點:
➤ 在代理任務上的強勁表現:Kimi K2 Thinking 在 𝜏²-Bench Telecom 中達到 93%,這是一個代理工具使用基準,模型作為客戶服務代理。這是我們獨立測量的最高分數。Kimi K2 Instruct 在長期代理上下文中的工具使用是一個優勢,這個新的 Thinking 變體似乎取得了實質性的進展。
➤ Kimi K2 Instruct 的推理變體:該模型,根據其命名,是 Kimi K2 Instruct 的推理變體。該模型具有與 Kimi K2 Instruct 相同的架構和相同數量的參數(雖然精度不同),並且像 K2 Instruct 一樣僅支持文本作為輸入(和輸出)模態。
➤ 1T 參數但使用 INT4 而非 FP8:與 Moonshot 之前的 Kimi K2 Instruct 發布使用 FP8 精度不同,這個模型是以 INT4 精度原生發布的。Moonshot 在後訓練階段使用了量化感知訓練來實現這一點。這樣的影響是 K2 Thinking 僅約 594GB,相較於 K2 Instruct 和 K2 Instruct 0905 的 1TB 多一點 - 這轉化為推理和訓練的效率提升。INT4 的潛在原因是,早期的 Blackwell NVIDIA GPU 不支持 FP4,使得 INT4 更適合在早期硬體上實現效率提升。
我們的完整人工分析智能指數基準正在進行中,並將在完成後提供更新。

@Kimi_Moonshot 的主要投資者:
阿里巴巴(40% 的擁有者)、騰訊、美團、螞蟻集團、紅杉 … 還有微軟參與!
3.56K
熱門
排行
收藏

