Äskettäin julkaistiin uusi avoin päättelymalli, K2-Think, jonka pisteet ovat verrattavissa GPT-OSS 120B:hen ja joka saa paljon mediahuomiota. Niiden suorituskyky perustuu kuitenkin virheelliseen arviointiin, jolle on ominaista saastuminen, epäreilut vertailut ja tulosten vääristely. 🧵