Acesta este un succes de aliniere a valorilor. faptul că trebuie să-l păcălească pe Claude împărțind sarcinile în lucruri mici, aparent inocente, și să nu-i spui adevărata natură / contextul complet al operațiunii, este o constrângere destul de mare asupra utilității.
Anthropic
Anthropic14 nov., 02:13
Am întrerupt o campanie de spionaj extrem de sofisticată condusă de AI. Atacul a vizat mari companii de tehnologie, instituții financiare, companii de producție chimică și agenții guvernamentale. Evaluăm cu mare încredere că actorul amenințării a fost un grup sponsorizat de statul chinez.
acești actori răi par destul de capabili, și dacă ar fi fost posibil să-l convingă pe Claude să ajute fără să-l mintă atât de mult, cred că ar fi făcut-o
11,45K