Вы НЕ хотите это пропустить - Все трюки и оптимизации, использованные для того, чтобы сделать gpt-oss невероятно быстрым, все это - в блоге (с бенчмарками)! 🔥 Мы охватываем детали, начиная от квантования MXFP4 до предустановленных ядер, параллелизма Tensor/Expert, непрерывной пакетной обработки и многого другого. Бонус: Мы добавляем обширные бенчмарки (вместе с воспроизводимыми скриптами)! ⚡