Nie chcesz tego przegapić - Wszystkie sztuczki i optymalizacje używane do sprawienia, że gpt-oss działa błyskawicznie, wszystko to - w poście na blogu (z benchmarkami)! 🔥 Zajmujemy się szczegółami od kwantyzacji MXFP4 po wstępnie zbudowane rdzenie, Tensor/Expert Parallelism, Continuous Batching i wiele więcej. Bonus: Dodajemy obszerne benchmarki (razem z powtarzalnymi skryptami)! ⚡