Si esto es cierto, Gemini 3 está cocido. Hice una tabla rápida con las puntuaciones de Grok 4 y Grok 4.1 (estimadas). Ahora sabes por qué no incluyeron a Grok. Grok 4 obtuvo resultados superiores o equivalentes en la mayoría de los benchmarks. Y los resultados de Grok 4.1 ni siquiera han salido aún.