Vous NE voulez PAS manquer ça - Tous les trucs et optimisations utilisés pour rendre gpt-oss incroyablement rapide, tout cela - dans un article de blog (avec des benchmarks) ! 🔥 Nous couvrons des détails allant de la quantification MXFP4 aux noyaux préconstruits, au parallélisme Tensor/Expert, au traitement continu par lots et bien plus encore. Bonus : Nous ajoutons des benchmarks détaillés (avec des scripts reproductibles) ! ⚡