Estoy comenzando una nueva serie de entrevistas sobre @interconnectsai con todos los principales laboratorios de modelos abiertos de todo el mundo para mostrar por qué la gente está haciendo esto, cómo la gente entrena grandes modelos y hacia dónde se dirige el ecosistema. El primero es el equipo Ling (@AntLingAGI) / InclusionAI (@TheInclusionAI) de Ant Group que lanzó excelentes modelos este verano después de comenzar el proyecto en reacción a DeepSeek. ¡Solo 6-8 meses! Estos modelos, Ling (modelo de instrucción / base), Ring (razonador) y Ming (multilingüe) son una mezcla bastante estándar de modelos de expertos (MoE) de 300B a 1T. También tuvieron muchas cosas geniales recientemente sobre cómo escalar su infraestructura de RL aquí (consulte la publicación para obtener una revisión de todas sus publicaciones y modelos recientes). Ant Ling/InclusionAI se siente como uno de los laboratorios que podría dar el salto al nivel Kimi/Qwen en 2026 si los dados caen correctamente. Pronto vendrán más, ya que parece el momento perfecto para hacerlo, cuando los modelos abiertos son actualmente numerosos y de un rendimiento extremadamente alto.