المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أصدرت Alibaba Qwen3 Next 80B: نموذج التفكير الهجين ذو الأوزان المفتوحة الذي يحقق ذكاء مستوى DeepSeek V3.1 مع معلمات نشطة 3B فقط
الوجبات الرئيسية:
💡 بنية جديدة: أول نموذج يقدم نماذج الأساس "Qwen3-Next" الخاصة ب @Alibaba_Qwen ، مع العديد من قرارات الهندسة المعمارية الرئيسية مثل آلية الانتباه الهجينة ل Gated DeltaNet و Gated Attention ، والتناثر العالي مع حصة المعلمات النشطة بنسبة 3.8٪ ، مقارنة ب 9.4٪ ل Qwen3 235B
🧠 الذكاء: Qwen3 Next 80B (المنطق) يسجل 54 في مؤشر ذكاء التحليل الاصطناعي ، جنبا إلى جنب مع DeepSeek V3.1 (المنطق). يسجل المتغير غير المنطقي 45 ، بما يتماشى مع gpt-oss-20B و Llama Nemotron Super 49B v1.5 (المنطق)
💲 نموذج التسعير: التسعير لكل رمز مميز على @alibaba_cloud هو 0.5 دولار / 6 دولارات لكل 1 مليون رمز إدخال / إخراج للتفكير و 0.5 دولار / 2 دولار للمتغير غير المنطقي. يقارن هذا بارتفاع الأسعار ل Qwen3 235B 2507 بقيمة 0.7 دولار / 8.4 دولار مع المنطق و 0.7 دولار / 2.8 دولار بدونها - بانخفاض ≥25٪ اعتمادا على أعباء العمل
⚙️ تفاصيل النموذج: يحتوي النموذج على نافذة سياق أصلية تبلغ 256 ألف رمز مميز وهو نصي فقط ، بدون مدخلات أو مخرجات متعددة الوسائط. عند 80B فقط من المعلمات في FP8 ، يتناسب النموذج مع وحدة معالجة رسومات H200 واحدة

الأفضل
المُتصدِّرة
التطبيقات المفضلة