Um novo modelo de raciocínio aberto, K2-Think, foi recentemente lançado, ostentando pontuações comparáveis ao GPT-OSS 120B e recebendo muita atenção da mídia. No entanto, seu desempenho depende de uma avaliação falha marcada por contaminação, comparações injustas e má representação dos resultados. 🧵