Alibaba ha rilasciato Qwen3 Next 80B: un modello ibrido di ragionamento a pesi aperti che raggiunge un'intelligenza a livello di DeepSeek V3.1 con solo 3B di parametri attivi Punti chiave: 💡 Architettura innovativa: Primo modello a introdurre i modelli fondazione ‘Qwen3-Next’ di @Alibaba_Qwen, con diverse decisioni architettoniche chiave come un meccanismo di attenzione ibrido di Gated DeltaNet e Gated Attention, e alta scarsità con una quota di parametri attivi del 3,8%, rispetto al 9,4% per Qwen3 235B 🧠 Intelligenza: Qwen3 Next 80B (Ragionamento) ottiene 54 nell'Artificial Analysis Intelligence Index, posizionato accanto a DeepSeek V3.1 (Ragionamento). La variante non di ragionamento ottiene 45, in linea con gpt-oss-20B e Llama Nemotron Super 49B v1.5 (Ragionamento) 💲 Modello di pricing: Il prezzo per token su @alibaba_cloud è di $0.5/$6 per 1M di token di input/output per il ragionamento e $0.5/$2 per la variante non di ragionamento. Questo si confronta con prezzi più alti per Qwen3 235B 2507 di $0.7/$8.4 con ragionamento e $0.7/$2.8 senza - una riduzione ≥25% a seconda dei carichi di lavoro ⚙️ Dettagli del modello: Il modello ha una finestra di contesto nativa di 256k token ed è solo testo, senza input o output multimodali. Con solo 80B di parametri a FP8, il modello si adatta a una singola GPU H200