Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Estou a começar uma nova série de entrevistas no @interconnectsai com todos os principais laboratórios de modelos abertos em todo o mundo para mostrar por que as pessoas estão a fazer isto, como as pessoas treinam grandes modelos e para onde está a ir o ecossistema.
A primeira é a equipa Ling do Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) que lançou grandes modelos este verão após iniciar o projeto em reação ao DeepSeek. Apenas 6-8 meses!
Estes modelos, Ling (modelo de instrução/base), Ring (raciocinador) e Ming (multilingue) são uma mistura bastante padrão de modelos de mistura de especialistas (MoE) com parâmetros de 300B a 1T. Eles também tiveram muitas coisas ótimas recentemente sobre a escalabilidade da sua infraestrutura de RL aqui (veja a publicação para uma revisão de todas as suas publicações e modelos recentes).
Ant Ling/InclusionAI parece ser um dos laboratórios que poderia dar o salto para o nível Kimi/Qwen em 2026 se os dados caírem corretamente.
Mais estão a chegar em breve, pois parece ser o momento perfeito para fazer isto, quando os modelos abertos são atualmente numerosos e de desempenho extremamente elevado.

Top
Classificação
Favoritos

