DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Alibaba hat Qwen3 Next 80B veröffentlicht: ein hybrides Modell mit offenen Gewichten, das eine Intelligenz auf DeepSeek V3.1-Niveau mit nur 3B aktiven Parametern erreicht. Wichtige Erkenntnisse: 💡 Neuartige Architektur: Erstes Modell, das die ‚Qwen3-Next‘-Grundlagenmodelle von @Alibaba_Qwen einführt, mit mehreren wichtigen Architekturentscheidungen wie einem hybriden Aufmerksamkeitsmechanismus von Gated DeltaNet und Gated Attention sowie einer hohen Sparsamkeit mit einem Anteil aktiver Parameter von 3,8 %, im Vergleich zu 9,4 % für Qwen3 235B. 🧠 Intelligenz: Qwen3 Next 80B (Reasoning) erzielt 54 im Artificial Analysis Intelligence Index und wird zusammen mit DeepSeek V3.1 (Reasoning) platziert. Die nicht-reasoning Variante erzielt 45, im Einklang mit gpt-oss-20B und Llama Nemotron Super 49B v1.5 (Reasoning). 💲 Preisgestaltung: Die Preisgestaltung pro Token auf @alibaba_cloud beträgt $0,5/$6 pro 1M Eingabe-/Ausgabetoken für Reasoning und $0,5/$2 für die nicht-reasoning Variante. Dies steht im Vergleich zu höheren Preisen für Qwen3 235B 2507 von $0,7/$8,4 mit Reasoning und $0,7/$2,8 ohne - eine Reduzierung von ≥25 % je nach Arbeitslast. ⚙️ Modelldetails: Das Modell hat ein natives Kontextfenster von 256k Tokens und ist nur textbasiert, ohne multimodale Eingaben oder Ausgaben. Mit nur 80B Parametern im FP8 passt das Modell auf eine einzelne H200 GPU.

Top

Ranking

Favoriten