Nytt @Scale_AI papper! Boven bakom belöningshacking? Vi spårar det till felspecifikation i svansen med hög belöning. Vår lösning: rubrikbaserade belöningar för att skilja "utmärkta" svar från "bra". Resultatet: Mindre hacking, starkare efter träningen!