你絕對不想錯過這個 - 所有讓 gpt-oss 變得極其快速的技巧和優化,全部都在一篇博客文章中(附帶基準測試)!🔥 我們涵蓋的細節包括從 MXFP4 量化到預構建內核、張量/專家並行、持續批處理等等。 額外獎勵:我們添加了大量基準測試(以及可復現的腳本)!⚡