Das wollen Sie NICHT verpassen - Alle Tricks und Optimierungen, die verwendet werden, um gpt-oss blitzschnell zu machen, alles davon - in einem Blogbeitrag (mit Benchmarks)! 🔥 Wir behandeln Details von der MXFP4-Quantisierung bis hin zu vorgefertigten Kernen, Tensor/Expert Parallelismus, kontinuierlichem Batching und vielem mehr. Bonus: Wir fügen umfangreiche Benchmarks (neben reproduzierbaren Skripten) hinzu! ⚡