Estoy comenzando una nueva serie de entrevistas en @interconnectsai con todos los principales laboratorios de modelos abiertos de todo el mundo para mostrar por qué la gente está haciendo esto, cómo la gente entrena grandes modelos y hacia dónde va el ecosistema. El primero es el equipo de Ling de Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) que lanzó grandes modelos este verano después de iniciar el proyecto en reacción a DeepSeek. ¡Solo 6-8 meses! Estos modelos, Ling (modelo instructivo/base), Ring (razonador) y Ming (multilingüe) son una mezcla bastante estándar de modelos de expertos (MoE) de 300B a 1T parámetros. También han tenido muchas cosas interesantes recientemente sobre la escalabilidad de su infraestructura de RL aquí (vea la publicación para una revisión de todas sus publicaciones y modelos recientes). Ant Ling/InclusionAI se siente como uno de los laboratorios que podría dar el salto al nivel de Kimi/Qwen en 2026 si los dados caen correctamente. Pronto vendrán más, ya que parece el momento perfecto para hacer esto, cuando los modelos abiertos son actualmente numerosos y de rendimiento extremadamente alto.