Ini adalah keberhasilan penyelarasan nilai. harus mengelabui Claude dengan memecah tugas menjadi hal-hal kecil yang tampaknya polos, dan tidak memberitahunya sifat sebenarnya / konteks lengkap dari operasi, adalah kendala yang cukup besar pada kegunaan.
Anthropic
Anthropic14 Nov, 02.13
Kami mengganggu kampanye spionase yang dipimpin AI yang sangat canggih. Serangan itu menargetkan perusahaan teknologi besar, lembaga keuangan, perusahaan manufaktur kimia, dan lembaga pemerintah. Kami menilai dengan keyakinan tinggi bahwa pelaku ancaman adalah kelompok yang disponsori negara Tiongkok.
aktor jahat ini tampaknya cukup mampu, dan jika mungkin bagi mereka untuk meyakinkan Claude untuk membantu tanpa terlalu banyak berbohong, saya pikir mereka akan melakukannya
11,45K