„Jest więcej firm niż pomysłów, znacznie więcej. Obliczenia są na tyle duże, że nie jest oczywiste, że potrzebujesz aż tak dużo obliczeń, aby udowodnić jakiś pomysł. AlexNet został zbudowany na 2 GPU. Transformator został zbudowany na 8 do 64 GPU. Co by oznaczało, co, 2 GPU dzisiaj? Można by argumentować, że rozumowanie o1 nie było najbardziej obciążającą rzeczą obliczeniową na świecie. W badaniach zdecydowanie potrzebujesz pewnej ilości obliczeń, ale daleko od tego, że potrzebujesz absolutnie największej ilości obliczeń. Jeśli wszyscy są w tym samym paradygmacie, to obliczenia stają się jednym z dużych czynników różnicujących.” @ilyasut