«Компаний больше, чем идей, довольно значительно. Вычислительных мощностей достаточно, чтобы не было очевидно, что вам нужно гораздо больше вычислений, чтобы доказать какую-то идею. AlexNet был построен на 2 GPU. Трансформер был построен на 8 до 64 GPU. Что бы это было, 2 GPU на сегодняшний день? Можно утверждать, что o1-рассуждение не было самым вычислительно тяжелым в мире. Для исследований вам определенно нужно какое-то количество вычислений, но далеко не очевидно, что вам нужно абсолютно максимальное количество вычислений. Если все находятся в одной парадигме, то вычисления становятся одним из больших отличий.» @ilyasut