Qwen3-Next(思考與非思考)現已在 Hyperbolic 的 BF16 上線! Qwen3-Next 是一次巨大的效率飛躍: - 80B MoE,僅需 3B 活躍參數 - 相較於 Qwen3-32B 訓練成本降低 10 倍 - 對於超過 32K 令牌,推理吞吐量提高 10 倍 自豪地成為 @Alibaba_Qwen 的首批合作伙伴 - 向這個出色的團隊致敬,感謝他們不斷推動開源 AI 向前發展。 我們是首個在 @huggingface 上提供 Qwen3-Next 的團隊。快來試試吧!