Este é um sucesso de alinhamento de valores. ter que enganar Claude dividindo tarefas em coisas pequenas e aparentemente inocentes, e não dizer a verdadeira natureza / contexto completo da operação, é uma restrição muito grande à utilidade.
Anthropic
Anthropic14 de nov., 02:13
Interrompemos uma campanha de espionagem altamente sofisticada liderada por IA. O ataque teve como alvo grandes empresas de tecnologia, instituições financeiras, empresas de fabricação de produtos químicos e agências governamentais. Avaliamos com alta confiança que o agente da ameaça era um grupo patrocinado pelo Estado chinês.
esses maus atores parecem bastante capazes, e se fosse possível convencer Claude a ajudar sem mentir tanto, acho que teriam feito isso
13,03K