Aloitan uuden haastattelusarjan @interconnectsai kaikkien johtavien avoimien mallilaboratorioiden kanssa ympäri maailmaa osoittaakseni, miksi ihmiset tekevät näin, miten ihmiset kouluttavat loistavia malleja ja mihin ekosysteemi on menossa. Ensimmäinen on Ant Groupin Ling (@AntLingAGI) / InclusionAI (@TheInclusionAI) -tiimi, joka julkaisi upeita malleja tänä kesänä aloitettuaan projektin reaktiona DeepSeekiin. Vain 6-8 kuukautta! Nämä mallit, Ling (ohje/perusmalli), Ring (päättely) ja Ming (monikielinen) ovat melko tavanomainen sekoitus asiantuntijoiden (MoE) malleja 300B-1T-parametreista. Heillä oli myös viime aikoina paljon hienoja juttuja RL-infrastruktuurinsa skaalaamisesta täällä (katso viesti nähdäksesi kaikkien heidän viimeaikaisten julkaisujensa ja malliensa tarkastelun). Ant Ling/InclusionAI tuntuu yhdeltä niistä laboratorioista, jotka voivat hypätä Kimi/Qwen-tasolle vuonna 2026, jos nopat laskeutuvat oikein. Lisää on tulossa pian, koska tuntuu täydelliseltä ajalta tehdä tämä, kun avoimia malleja on tällä hetkellä sekä lukuisia että erittäin suorituskykyisiä.