NO querrás perderte esto: todos los trucos y optimizaciones utilizados para hacer que gpt-oss sea increíblemente rápido, ¡todo en una publicación de blog (con puntos de referencia)! 🔥 Cubrimos detalles que van desde la cuantificación MXFP4 hasta kernels preconstruidos, paralelismo tensor / experto, procesamiento continuo por lotes y mucho más Bono: ¡Agregamos puntos de referencia extensos (junto con scripts reproducibles)! ⚡