Anda TIDAK ingin melewatkan ini - Semua trik dan pengoptimalan yang digunakan untuk membuat gpt-oss sangat cepat, semuanya - dalam posting blog (dengan tolok ukur)! 🔥 Kami membahas detail mulai dari kuantisasi MXFP4 hingga, kernel bawaan, Tensor/Expert Parallelism, Continuous Batching, dan banyak lagi Bonus: Kami menambahkan tolok ukur ekstensif (bersama dengan skrip yang dapat direproduksi)! ⚡