Detta är en framgång för värdejustering. Att behöva lura Claude genom att dela upp uppgifter i små, till synes oskyldiga saker, och inte berätta för den om den sanna karaktären / hela sammanhanget för operationen, är en ganska stor begränsning av användbarheten.
Anthropic
Anthropic14 nov. 02:13
Vi avbröt en mycket sofistikerad AI-ledd spionagekampanj. Attacken riktade sig mot stora teknikföretag, finansinstitut, kemiska tillverkningsföretag och statliga myndigheter. Vi bedömer med hög säkerhet att hotaktören var en kinesisk statsstödd grupp.
dessa dåliga skådespelare verkar ganska kapabla, och om det var möjligt för dem att övertyga Claude att hjälpa till utan att ljuga för det så mycket, tror jag att de skulle ha gjort det
13,36K