Wenn das wahr ist, ist Gemini 3 erledigt. Ich habe eine schnelle Tabelle mit den Grok 4 und Grok 4.1 (geschätzten) Ergebnissen erstellt. Jetzt weißt du, warum sie Grok nicht einbezogen haben. Grok 4 erzielte in den meisten Benchmarks entweder überlegene oder gleichwertige Ergebnisse. Und die Ergebnisse von Grok 4.1 sind noch nicht einmal veröffentlicht.