Je commence une nouvelle série d'interviews sur @interconnectsai avec tous les principaux laboratoires de modèles ouverts à travers le monde pour montrer pourquoi les gens font cela, comment les gens entraînent de grands modèles, et où va l'écosystème. Le premier est l'équipe Ling d'Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) qui a publié de grands modèles cet été après avoir lancé le projet en réaction à DeepSeek. Seulement 6 à 8 mois ! Ces modèles, Ling (modèle instructif/de base), Ring (raisonneur) et Ming (multilingue) sont un mélange assez standard de modèles d'experts (MoE) de 300B à 1T de paramètres. Ils ont également eu beaucoup de bonnes choses récemment sur l'extension de leur infrastructure RL ici (voir le post pour un aperçu de toutes leurs publications et modèles récents). Ant Ling/InclusionAI semble être l'un des laboratoires qui pourrait faire le saut vers le niveau Kimi/Qwen en 2026 si les dés tombent correctement. D'autres arrivent bientôt, car il semble que ce soit le moment parfait pour le faire, alors que les modèles ouverts sont actuellement à la fois nombreux et extrêmement performants.