Alibaba wydało Qwen3 Next 80B: model hybrydowy z otwartymi wagami, który osiąga inteligencję na poziomie DeepSeek V3.1 przy zaledwie 3B aktywnych parametrów Kluczowe informacje: 💡 Nowa architektura: Pierwszy model wprowadzający modele bazowe @Alibaba_Qwen 'Qwen3-Next', z kilkoma kluczowymi decyzjami architektonicznymi, takimi jak hybrydowy mechanizm uwagi Gated DeltaNet i Gated Attention oraz wysoka rzadkość z udziałem 3,8% aktywnych parametrów, w porównaniu do 9,4% dla Qwen3 235B 🧠 Inteligencja: Qwen3 Next 80B (Rozumowanie) uzyskuje 54 w Indeksie Inteligencji Analizy Sztucznej, plasując się obok DeepSeek V3.1 (Rozumowanie). Wariant bez rozumowania uzyskuje 45, zgodnie z gpt-oss-20B i Llama Nemotron Super 49B v1.5 (Rozumowanie) 💲 Model cenowy: Cena za token na @alibaba_cloud wynosi 0,5 USD/6 USD za 1M tokenów wejściowych/wyjściowych dla rozumowania i 0,5 USD/2 USD dla wariantu bez rozumowania. To w porównaniu do wyższych cen dla Qwen3 235B 2507 wynoszących 0,7 USD/8,4 USD z rozumowaniem i 0,7 USD/2,8 USD bez - redukcja ≥25% w zależności od obciążenia ⚙️ Szczegóły modelu: Model ma natywny kontekst okna 256k tokenów i jest tylko tekstowy, bez multimodalnych wejść lub wyjść. Przy zaledwie 80B parametrów w FP8 model mieści się na pojedynczym GPU H200