Це успіх у вирівнюванні цінностей. Необхідність обдурити Клода, розбивши завдання на дрібні, здавалося б, невинні речі, і не розповісти йому справжню природу / повний контекст операції, є досить серйозним обмеженням корисності.
Anthropic
Anthropic14 лист., 02:13
Ми зірвали надзвичайно складну шпигунську кампанію під керівництвом штучного інтелекту. Атака була націлена на великі технологічні компанії, фінансові установи, компанії з виробництва хімікатів та державні установи. Ми з високою впевненістю оцінюємо, що зловмисником була група, що фінансується китайською державою.
ці погані актори здаються досить здібними, і якби їм вдалося переконати Клода допомогти, не брешучи так сильно, я думаю, вони б це зробили
13,03K