著しい。また中国...
Artificial Analysis
Artificial Analysis11月7日 05:10
MoonshotAI は、Tau2 Bench Telecom エージェント ベンチマークで #1 を達成し、新しい主要なオープン ウェイト モデルとなる可能性がある Kimi K2 Thinking の新しい推論バリアントである Kimi K2 Thinking をリリースしました Kimi K2 Thinkingは、これまでで最大のオープンウェイトモデルの1つで、合計パラメータは1Tで、32Bがアクティブです。K2 Thinkingは、2025年7月と9月にリリースされた非推論Kimi K2 Instructモデルに続く、@Kimi_MoonshotのKimi K2モデルファミリーの最初の推論モデルリリースです。 重要なポイント: ➤ エージェント タスクでの強力なパフォーマンス: Kimi K2 Thinking は、モデルがカスタマー サービス エージェントとして機能するエージェント ツール使用ベンチマークである τ²-Bench Telecom で 93% を達成しました。これは、私たちが独自に測定した最高のスコアです。長い地平線のエージェントの文脈でのツールの使用は、Kimi K2 Instructの強みであり、この新しい思考バリアントは大きな進歩を遂げているようです ➤ Kimi K2 Instruct の推論バリアント: このモデルは、その名前にあるように、Kimi K2 Instruct の推論バリアントです。このモデルは、Kimi K2 Instruct と同じアーキテクチャと同じ数のパラメーター (精度は異なりますが) を持ち、K2 と同様に、Instruct は入力 (および出力) モダリティとしてテキストのみをサポートします ➤ 1T パラメータですが、FP8 ではなく INT4: FP8 精度を使用した Moonshot の以前の Kimi K2 Instruct リリースとは異なり、このモデルは INT4 精度でネイティブにリリースされています。Moonshot は、これを実現するために、トレーニング後の段階で量子化を意識したトレーニングを使用しました。この影響により、K2 Instruct と K2 Instruct 0905 の 1 TB 強と比較して、K2 Thinking はわずか ~594 GB であり、推論とトレーニングの効率が向上します。INT4 の潜在的な理由は、Blackwell 以前の NVIDIA GPU が FP4 をサポートしていないため、INT4 が以前のハードウェアで効率の向上を達成するのにより適していることです。 人工分析知能インデックスのベンチマークのフルセットは進行中であり、完了次第更新を提供します。
@Kimi_Moonshotの主な投資家: アリババ(40%の所有者)、テンセント、美団、アントグループ、紅山...そしてマイクロソフトが参加しました!
3.53K