Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alibaba vydala Qwen3 Next 80B: otevřený model hybridního uvažování, který dosahuje inteligence na úrovni DeepSeek V3.1 pouze s aktivními parametry 3B
Klíčové poznatky:
💡 Nová architektura: První model, který představil základní modely Qwen3-Next společnosti @Alibaba_Qwen s několika klíčovými rozhodnutími o architektuře, jako je hybridní mechanismus pozornosti Gated DeltaNet a Gated Attention, a vysokou řídkostí s podílem aktivních parametrů 3,8 % ve srovnání s 9,4 % u Qwen3 235B
🧠 Inteligence: Qwen3 Next 80B (uvažování) má v indexu umělé analýzy skóre 54, umístěný vedle DeepSeek V3.1 (uvažování). Varianta bez rozumu má skóre 45, což je v souladu s gpt-oss-20B a Llama Nemotron Super 49B v1.5 (uvažování)
💲 Cenový model: Cena za token na @alibaba_cloud je $0,5/$6 za 1 milion vstupních/výstupních tokenů pro uvažování a $0,5/$2 pro variantu bez uvažování. To je srovnatelné s vyššími cenami za Qwen3 235B 2507 ve výši 0,7 USD/8,4 USD s odůvodněním a 0,7 USD/2,8 USD bez – snížení o 25 % ≥ v závislosti na pracovním vytížení
⚙️ Podrobnosti o modelu: Model má nativní kontextové okno s 256 tisíci tokeny a je pouze textový, bez multimodálních vstupů nebo výstupů. Při parametrech pouhých 80B na FP8 se model vejde na jeden GPU H200

Top
Hodnocení
Oblíbené