DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik begin een nieuwe serie interviews op @interconnectsai met alle toonaangevende open model laboratoria over de hele wereld om te laten zien waarom mensen dit doen, hoe mensen geweldige modellen trainen en waar het ecosysteem naartoe gaat. De eerste is het Ling-team van Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) dat deze zomer geweldige modellen heeft uitgebracht na het starten van het project als reactie op DeepSeek. Slechts 6-8 maanden! Deze modellen, Ling (instruct/base model), Ring (redenaar) en Ming (meertalig) zijn een vrij standaard mengsel van experts (MoE) model van 300B tot 1T parameters. Ze hebben ook recent veel geweldige dingen gehad over het schalen van hun RL-infrastructuur hier (zie de post voor een overzicht van al hun recente publicaties en modellen). Ant Ling/InclusionAI voelt als een van de laboratoria die de sprong naar het Kimi/Qwen-niveau in 2026 zou kunnen maken als de dobbelstenen goed vallen. Er komen binnenkort meer, het voelt als het perfecte moment om dit te doen, wanneer open modellen momenteel zowel talrijk als extreem hoog presterend zijn.

Boven

Positie

Favorieten