Lançado o treinador totalmente assíncrono na mainnet do @grail_ai, treinando um modelo de 7B 🚀 O treinamento agora ocorre continuamente a partir de um buffer de replay! Sem esperar pela comunicação. Isto desbloqueou 2k+ de contexto e nos permitiu escalar de modelos de 1.5B → 7B e até maiores mais tarde.