Een nieuw open redeneermodel, K2-Think, werd onlangs uitgebracht met scores die vergelijkbaar zijn met GPT-OSS 120B en krijgt veel media-aandacht. Hun prestaties zijn echter afhankelijk van gebrekkige evaluatie, gekenmerkt door besmetting, oneerlijke vergelijkingen en verkeerde voorstelling van resultaten. 🧵