Hârtie @Scale_AI nouă! Vinovatul din spatele hacking-ului de recompense? Îl urmărim la specificații greșite în coada cu recompense mari. Soluția noastră: recompense bazate pe rubrică pentru a deosebi răspunsurile "excelente" de "grozav". Rezultatul: mai puțin hacking, mai puternic post-antrenament!