Non vuoi perderti questo - Tutti i trucchi e le ottimizzazioni utilizzati per rendere gpt-oss incredibilmente veloce, tutto in un post sul blog (con benchmark)! 🔥 Copriamo dettagli che vanno dalla quantizzazione MXFP4 a kernel precompilati, Tensor/Expert Parallelism, Continuous Batching e molto altro Bonus: Aggiungiamo benchmark estesi (insieme a script riproducibili)! ⚡