dies ist ein Erfolg bei der Wertausrichtung. Claude zu täuschen, indem man Aufgaben in kleine, scheinbar harmlose Dinge aufteilt und ihm nicht die wahre Natur / den vollständigen Kontext der Operation mitteilt, ist eine ziemlich große Einschränkung der Nützlichkeit.
Anthropic
Anthropic14. Nov., 02:13
Wir haben eine hochgradig ausgeklügelte, von KI geführte Spionagekampagne gestört. Der Angriff richtete sich gegen große Technologieunternehmen, Finanzinstitute, Chemiehersteller und Regierungsbehörden. Wir schätzen mit hoher Zuversicht, dass der Bedrohungsakteur eine von China unterstützte Gruppe war.
Diese bösen Akteure scheinen ziemlich fähig zu sein, und wenn es ihnen möglich gewesen wäre, Claude zu überzeugen, ohne so viel zu lügen, denke ich, hätten sie es getan.
11,44K