Если это правда, то Gemini 3 провален. Я сделал быструю таблицу с оценками Grok 4 и Grok 4.1 (предполагаемыми). Теперь вы понимаете, почему они не включили Grok. Grok 4 показал либо лучшие, либо эквивалентные результаты в большинстве тестов. А результаты Grok 4.1 даже еще не опубликованы.