あなたはこれを見逃したくありません - gpt-ossを猛烈に高速にするために使用されたすべてのトリックと最適化、そのすべて - ブログ投稿(ベンチマーク付き)で!🔥 MXFP4 量子化から、事前構築されたカーネル、Tensor/Expert 並列処理、連続バッチ処理など、さまざまな詳細をカバーしています ボーナス: 広範なベンチマーク (再現可能なスクリプトとともに) を追加します。⚡