Ви НЕ ХОЧЕТЕ пропустити це - Всі трюки та оптимізації, які використовуються для створення блискавично швидкого gpt-oss, все це - у блозі (з бенчмарками)! 🔥 Ми охоплюємо деталі, починаючи від квантування MXFP4 і закінчуючи готовими ядрами, тензорним/експертним паралелізмом, безперервним пакетуванням та багато іншого Бонус: Ми додаємо розширені тести (разом із відтворюваними скриптами)! ⚡