Estou a começar uma nova série de entrevistas no @interconnectsai com todos os principais laboratórios de modelos abertos em todo o mundo para mostrar por que as pessoas estão a fazer isto, como as pessoas treinam grandes modelos e para onde está a ir o ecossistema. A primeira é a equipa Ling do Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) que lançou grandes modelos este verão após iniciar o projeto em reação ao DeepSeek. Apenas 6-8 meses! Estes modelos, Ling (modelo de instrução/base), Ring (raciocinador) e Ming (multilingue) são uma mistura bastante padrão de modelos de mistura de especialistas (MoE) com parâmetros de 300B a 1T. Eles também tiveram muitas coisas ótimas recentemente sobre a escalabilidade da sua infraestrutura de RL aqui (veja a publicação para uma revisão de todas as suas publicações e modelos recentes). Ant Ling/InclusionAI parece ser um dos laboratórios que poderia dar o salto para o nível Kimi/Qwen em 2026 se os dados caírem corretamente. Mais estão a chegar em breve, pois parece ser o momento perfeito para fazer isto, quando os modelos abertos são atualmente numerosos e de desempenho extremamente elevado.