你绝对不想错过这个 - 所有让 gpt-oss 变得极其快速的技巧和优化,全部都在一篇博客文章中(附带基准测试)!🔥 我们涵盖的细节包括从 MXFP4 量化到预构建内核、张量/专家并行、持续批处理等等。 额外奖励:我们添加了大量基准测试(以及可复现的脚本)!⚡