Você NÃO quer perder isso - Todos os truques e otimizações usados para tornar o gpt-oss incrivelmente rápido, tudo isso - em uma postagem de blog (com benchmarks)! 🔥 Cobrimos detalhes que vão desde a quantização MXFP4 até kernels pré-construídos, paralelismo Tensor/Expert, lotes contínuos e muito mais Bônus: adicionamos benchmarks extensos (junto com scripts reproduzíveis)! ⚡