Модель підлабузництва походить від RLHF, чи не так? Де люди частіше (загалом) оцінюють підлабузницькі реакції вище? Тоді ми можемо очікувати, що в міру вдосконалення моделей вони навчатимуться на стилях письма, хто віддасть перевагу більшій підлабузницькості порівняно з меншою і відповідним чином коригуватиме Ті, хто бажає зберегти здоровий глузд, можливо, захочуть подумати про те, щоб спробувати стати типом «менше» якомога швидше
2,31K