Alibaba a lancé Qwen3 Next 80B : un modèle hybride de raisonnement à poids ouverts qui atteint une intelligence de niveau DeepSeek V3.1 avec seulement 3B de paramètres actifs Points clés : 💡 Architecture novatrice : Premier modèle à introduire les modèles de base ‘Qwen3-Next’ d'@Alibaba_Qwen, avec plusieurs décisions architecturales clés telles qu'un mécanisme d'attention hybride de Gated DeltaNet et Gated Attention, et une forte sparsité avec une part de 3,8 % de paramètres actifs, contre 9,4 % pour Qwen3 235B 🧠 Intelligence : Qwen3 Next 80B (Raisonnement) obtient un score de 54 sur l'Indice d'Intelligence d'Analyse Artificielle, placé aux côtés de DeepSeek V3.1 (Raisonnement). La variante non raisonnement obtient un score de 45, en ligne avec gpt-oss-20B et Llama Nemotron Super 49B v1.5 (Raisonnement) 💲 Modèle de tarification : La tarification par token sur @alibaba_cloud est de 0,5 $/6 $ par 1M de tokens d'entrée/sortie pour le raisonnement et de 0,5 $/2 $ pour la variante non raisonnement. Cela se compare à des prix plus élevés pour Qwen3 235B 2507 de 0,7 $/8,4 $ avec raisonnement et de 0,7 $/2,8 $ sans - une réduction ≥25 % selon les charges de travail ⚙️ Détails du modèle : Le modèle a une fenêtre de contexte native de 256k tokens et est uniquement textuel, sans entrées ou sorties multimodales. Avec seulement 80B de paramètres en FP8, le modèle tient sur un seul GPU H200