Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Nezávislá analýza modelů AI a poskytovatelů hostingu - vyberte si nejlepší model a poskytovatele API pro váš případ použití
Alibaba vydala Qwen3 Next 80B: otevřený model hybridního uvažování, který dosahuje inteligence na úrovni DeepSeek V3.1 pouze s aktivními parametry 3B
Klíčové poznatky:
💡 Nová architektura: První model, který představil základní modely Qwen3-Next společnosti @Alibaba_Qwen s několika klíčovými rozhodnutími o architektuře, jako je hybridní mechanismus pozornosti Gated DeltaNet a Gated Attention, a vysokou řídkostí s podílem aktivních parametrů 3,8 % ve srovnání s 9,4 % u Qwen3 235B
🧠 Inteligence: Qwen3 Next 80B (uvažování) má v indexu umělé analýzy skóre 54, umístěný vedle DeepSeek V3.1 (uvažování). Varianta bez rozumu má skóre 45, což je v souladu s gpt-oss-20B a Llama Nemotron Super 49B v1.5 (uvažování)
💲 Cenový model: Cena za token na @alibaba_cloud je $0,5/$6 za 1 milion vstupních/výstupních tokenů pro uvažování a $0,5/$2 pro variantu bez uvažování. To je srovnatelné s vyššími cenami za Qwen3 235B 2507 ve výši 0,7 USD/8,4 USD s odůvodněním a 0,7 USD/2,8 USD bez – snížení o 25 % ≥ v závislosti na pracovním vytížení
⚙️ Podrobnosti o modelu: Model má nativní kontextové okno s 256 tisíci tokeny a je pouze textový, bez multimodálních vstupů nebo výstupů. Při parametrech pouhých 80B na FP8 se model vejde na jeden GPU H200

65
Spouštíme náš průzkum o stavu generativních médií 2025 za podpory @fal! Zúčastněte se a získejte kompletní zprávu z průzkumu a vyhrajte pár Meta Ray-Banů 🕶️
Průzkum provádíme, abychom získali poznatky o stavu generativních médií v roce 2025. To zahrnuje pohledy na to, jak organizace používají, vybírají a přistupují k modelům obrázků, videa a hudby!
Proč se zúčastnit?
✅ Obdržet bezplatnou kopii rozšířené zprávy o průzkumu (veřejně dostupná bude pouze omezená verze).
✅ Šance vyhrát pár brýlí 🕶️ Ray-Ban Meta AI
✅ Přispívat ke sdílení poznatků o klíčových trendech utvářejících generativní média
Odkaz ve vlákně níže! ⬇️⬇️⬇️⬇️⬇️⬇️⬇️
118
DeepSeek uvádí na trh V3.1, sjednocuje V3 a R1 do hybridního modelu uvažování s postupným zvyšováním inteligence
Přírůstkové zvýšení inteligence: Počáteční výsledky benchmarkingu pro DeepSeek V3.1 ukazují index umělé analýzy 60 v režimu uvažování, což je nárůst oproti skóre R1 59. V režimu bez uvažování dosahuje verze V3.1 skóre 49, což je větší nárůst oproti dřívějšímu skóre V3 0324 44. To nechává V3.1 (uvažování) za nejnovějším Qwen3 235B 2507 (uvažování) - DeepSeek si nevzal zpět vedení.
Hybridní uvažování: @deepseek_ai poprvé přešla na hybridní model uvažování, který podporuje režimy uvažování i bez uvažování. Přechod společnosti DeepSeek na jednotný model hybridního uvažování napodobuje přístup společností OpenAI, Anthropic a Google. Je však zajímavé poznamenat, že Alibaba nedávno opustila svůj hybridní přístup, který upřednostňovala pro Qwen3 se svými samostatnými vydáními modelů uvažování a instrukcí Qwen3 2507.
Volání funkcí / použití nástroje: Zatímco DeepSeek tvrdí, že pro model je vylepšeno volání funkcí, DeepSeek V3.1 nepodporuje volání funkcí v režimu uvažování. To pravděpodobně podstatně omezí jeho schopnost podporovat agentské pracovní postupy s požadavky na inteligenci, včetně kódovacích agentů.
Použití tokenů: DeepSeek V3.1 má v režimu uvažování přírůstkově vyšší skóre než DeepSeek R1 a používá o něco méně tokenů napříč hodnoceními, která používáme pro Artificial Analysis Intelligence Index. V režimu nerozumu používá o něco více tokenů než V3 0324 - ale stále několikanásobně méně než ve svém vlastním režimu uvažování.
API: API první strany DeepSeek nyní poskytuje nový model DeepSeek V3.1 na svých koncových bodech chatu i uvažování – jednoduše změní, zda </think> je modelu v šabloně chatu poskytnut token koncového myšlení, aby bylo možné určit, zda bude model uvažovat.
Architektura: DeepSeek V3.1 je architektonicky identický s předchozími modely V3 a R1, s celkovými parametry 671B a aktivními parametry 37B.
Důsledky: Doporučujeme opatrnost při vytváření jakýchkoli předpokladů o tom, co toto vydání znamená o pokroku společnosti DeepSeek směrem k budoucímu modelu, který je v pověstech označován jako V4 nebo R2. Podotýkáme, že společnost DeepSeek již dříve vydala finální model postavený na jejich architektuře V2 10. prosince 2024, pouhé dva týdny před vydáním V3.


407
Top
Hodnocení
Oblíbené