Saya memulai serangkaian wawancara baru di @interconnectsai dengan semua laboratorium model terbuka terkemuka di seluruh dunia untuk menunjukkan mengapa orang melakukan ini, bagaimana orang melatih model hebat, dan ke mana arah ekosistem. Yang pertama adalah tim Ling (@AntLingAGI) / InclusionAI (@TheInclusionAI) Ant Group yang merilis model hebat musim panas ini setelah memulai proyek sebagai reaksi terhadap DeepSeek. Hanya 6-8 bulan! Model-model ini, Ling (model instruksi/dasar), Ring (penalaran) dan Ming (multibahasa) adalah campuran model ahli (MoE) yang cukup standar dari parameter 300B hingga 1T. Mereka juga memiliki banyak hal hebat baru-baru ini tentang menskalakan infrastruktur RL mereka di sini (lihat posting untuk ulasan semua publikasi dan model terbaru mereka). Ant Ling/InclusionAI terasa seperti salah satu lab yang bisa melompat ke tingkat Kimi/Qwen pada tahun 2026 jika dadu mendarat dengan benar. Lebih banyak lagi akan segera hadir, karena rasanya seperti waktu yang tepat untuk melakukan ini, ketika model terbuka saat ini banyak dan berkinerja sangat tinggi.