Você NÃO quer perder isso - Todos os truques e otimizações usados para tornar o gpt-oss incrivelmente rápido, tudo isso - em um post de blog (com benchmarks)! 🔥 Cobrimos detalhes que vão desde a quantização MXFP4 até, núcleos pré-construídos, Paralelismo Tensor/Expert, Batching Contínuo e muito mais Bônus: Adicionamos benchmarks extensivos (junto com scripts reproduzíveis)! ⚡