Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Analisis independen model AI dan penyedia hosting - pilih model dan penyedia API terbaik untuk kasus penggunaan Anda
Alibaba telah merilis Qwen3 Next 80B: model penalaran hibrida bobot terbuka yang mencapai kecerdasan tingkat DeepSeek V3.1 dengan hanya parameter aktif 3B
Kesimpulan utama:
💡 Arsitektur baru: Model pertama yang memperkenalkan model fondasi 'Qwen3-Next' @Alibaba_Qwen, dengan beberapa keputusan arsitektur utama seperti mekanisme perhatian hibrida dari Gated DeltaNet dan Gated Attention, dan sparsity tinggi dengan pangsa parameter aktif 3,8%, dibandingkan dengan 9,4% untuk Qwen3 235B
🧠 Intelijen: Qwen3 Next 80B (Reasoning) mendapat skor 54 pada Artificial Analysis Intelligence Index, ditempatkan di samping DeepSeek V3.1 (Reasoning). Varian non-penalaran mendapat skor 45, sejalan dengan gpt-oss-20B dan Llama Nemotron Super 49B v1.5 (Penalaran)
💲 Model penetapan harga: Harga per token pada @alibaba_cloud adalah $0,5/$6 per 1 juta token input/output untuk penalaran dan $0,5/$2 untuk varian non-penalaran. Ini dibandingkan dengan harga yang lebih tinggi untuk Qwen3 235B 2507 sebesar $0,7/$8,4 dengan penalaran dan $0,7/$2,8 tanpa - pengurangan ≥25% tergantung pada beban kerja
⚙️ Detail model: Model ini memiliki jendela konteks asli 256 ribu token dan hanya teks, tanpa input atau output multimodal. Dengan hanya 80B parameter di FP8, model ini cocok pada satu GPU H200

83
Meluncurkan Survei State of Generative Media 2025 kami yang didukung oleh @fal! Ambil bagian untuk menerima laporan survei lengkap dan menangkan sepasang Meta Ray-Ban 🕶️
Kami melakukan survei untuk mengumpulkan wawasan tentang keadaan Media Generatif pada tahun 2025. Ini termasuk perspektif tentang bagaimana organisasi menggunakan, memilih, dan mengakses model Gambar, Video, dan Musik!
Mengapa berpartisipasi?
✅ Terima salinan gratis laporan survei yang diperpanjang (hanya versi terbatas yang akan tersedia untuk umum)
✅ Kesempatan untuk memenangkan sepasang Kacamata 🕶️ Ray-Ban Meta AI
✅ Berkontribusi untuk berbagi wawasan tentang tren utama yang membentuk Media Generatif
Tautkan di utas di bawah ini! ⬇️⬇️⬇️⬇️⬇️⬇️⬇️
140
DeepSeek meluncurkan V3.1, menyatukan V3 dan R1 menjadi model penalaran hibrida dengan peningkatan kecerdasan bertahap
Peningkatan kecerdasan tambahan: Hasil pembandingan awal untuk DeepSeek V3.1 menunjukkan Indeks Kecerdasan Analisis Buatan 60 dalam mode penalaran, naik dari skor R1 59. Dalam mode non-penalaran, V3.1 mencapai skor 49, peningkatan yang lebih besar dari skor V3 0324 sebelumnya sebesar 44. Ini meninggalkan V3.1 (penalaran) di belakang Qwen3 235B 2507 terbaru Alibaba (penalaran) - DeepSeek belum memimpin kembali.
Penalaran hibrida: @deepseek_ai telah beralih ke model penalaran hibrida untuk pertama kalinya - mendukung mode penalaran dan non-penalaran. Perpindahan DeepSeek ke model penalaran hibrida terpadu meniru pendekatan yang diambil oleh OpenAI, Anthropic, dan Google. Namun, menarik untuk dicatat bahwa Alibaba baru-baru ini meninggalkan pendekatan hibrida yang mereka sukai untuk Qwen3 dengan rilis terpisah dari model penalaran dan instruksi Qwen3 2507.
Pemanggilan fungsi / penggunaan alat: Sementara DeepSeek mengklaim pemanggilan fungsi yang ditingkatkan untuk model, DeepSeek V3.1 tidak mendukung pemanggilan fungsi saat dalam mode penalaran. Hal ini kemungkinan akan secara substansial membatasi kemampuannya untuk mendukung alur kerja agen dengan persyaratan intelijen, termasuk dalam agen pengkodean.
Penggunaan token: DeepSeek V3.1 mendapat skor yang lebih tinggi secara bertahap dalam mode penalaran daripada DeepSeek R1, dan menggunakan sedikit lebih sedikit token di seluruh eval yang kami gunakan untuk Indeks Kecerdasan Analisis Buatan. Dalam mode non-penalaran, ia menggunakan sedikit lebih banyak token daripada V3 0324 - tetapi masih beberapa kali lebih sedikit daripada dalam mode penalarannya sendiri.
API: API pihak pertama DeepSeek sekarang melayani model DeepSeek V3.1 baru pada titik akhir obrolan dan penalaran mereka - cukup mengubah apakah token pemikiran akhir </think> disediakan ke model dalam templat obrolan untuk mengontrol apakah model akan beralasan.
Arsitektur: DeepSeek V3.1 secara arsitektur identik dengan model V3 dan R1 sebelumnya, dengan parameter total 671B dan parameter aktif 37B.
Implikasi: Kami akan menyarankan untuk berhati-hati dalam membuat asumsi apa pun tentang apa yang tersirat dari rilis ini tentang kemajuan DeepSeek menuju model masa depan yang disebut dalam rumor sebagai V4 atau R2. Kami mencatat bahwa DeepSeek sebelumnya merilis model terakhir yang dibangun di atas arsitektur V2 mereka pada 10 Desember 2024, hanya dua minggu sebelum merilis V3.


432
Teratas
Peringkat
Favorit