アリババはQwen3 Next 80Bをリリースしました:3BのアクティブパラメータのみでDeepSeek V3.1レベルのインテリジェンスを実現するオープンウェイトハイブリッド推論モデル 重要なポイント: 💡 新しいアーキテクチャ:@Alibaba_Qwenの「Qwen3-Next」基盤モデルを導入した最初のモデルで、Gated DeltaNetとGated Attentionのハイブリッドアテンションメカニズムなど、いくつかの重要なアーキテクチャの決定と、Qwen3 235Bの9.4%と比較して3.8%のアクティブパラメータシェアの高いスパース性を備えています 🧠 インテリジェンス: Qwen3 Next 80B (Reasoning) は、Deep Seek V3.1 (Reasoning) と並んで、Artificial Analysis Intelligence Index で 54 のスコアを獲得しています。非推論バリアントのスコアは 45 で、gpt-oss-20B および Llama Nemotron Super 49B v1.5 (推論) と一致しています。 💲 価格モデル: @alibaba_cloud のトークンごとの価格は、推論の場合は 1M 入力/出力トークンあたり 0.5 ドル/6 ドル、非推論バリアントの場合は 0.5 ドル/2 ドルです。これは、Qwen3 235B 2507 の推論ありで 0.7 ドル/8.4 ドル、推論なしで 0.7 ドル/2.8 ドルの高値と比較して、ワークロードに応じて ≥25% の割引になります ⚙️ モデルの詳細: このモデルには 256k トークンのネイティブ コンテキスト ウィンドウがあり、テキストのみで、マルチモーダル入力または出力はありません。FP8 のパラメータはわずか 80B で、このモデルは単一の H200 GPU に適合します