Tohle si NECHCETE nechat ujít - Všechny triky a optimalizace použité k tomu, aby byl gpt-oss bleskově rychlý, to vše - v příspěvku na blogu (s benchmarky)! 🔥 Pokrýváme podrobnosti od kvantizace MXFP4 až po předpřipravená jádra, Tensor/Expert Parallelism, kontinuální dávkování a mnoho dalšího Bonus: Přidáváme rozsáhlé benchmarky (spolu s reprodukovatelnými skripty)! ⚡