Estou iniciando uma nova série de entrevistas no @interconnectsai com todos os principais laboratórios de modelos abertos em todo o mundo para mostrar por que as pessoas estão fazendo isso, como as pessoas treinam ótimos modelos e para onde o ecossistema está indo. A primeira é a equipe Ling (@AntLingAGI) / InclusionAI (@TheInclusionAI) do Ant Group, que lançou ótimos modelos neste verão depois de iniciar o projeto em reação ao DeepSeek. Apenas 6-8 meses! Esses modelos, Ling (instruir/modelo base), Ring (raciocinador) e Ming (multilíngue) são uma mistura bastante padrão de modelos de especialistas (MoE) de 300B a 1T parâmetros. Eles também tiveram muitas coisas boas recentemente sobre como escalar sua infraestrutura de RL aqui (veja o post para uma revisão de todas as suas publicações e modelos recentes). Ant Ling/InclusionAI parece um dos laboratórios que podem dar o salto para o nível Kimi/Qwen em 2026 se os dados caírem corretamente. Mais estão chegando em breve, pois parece o momento perfeito para fazer isso, quando os modelos abertos são atualmente numerosos e de desempenho extremamente alto.