Apresentando o INTELLECT-3: Escalonando RL para um modelo 100B+ MoE em nossa pilha de ponta a ponta
Alcançando desempenho de ponta para seu tamanho em matemática, código e raciocínio
Construído usando as mesmas ferramentas que colocamos em suas mãos, desde ambientes e avaliações, frameworks de RL, sandboxes e muito mais