Este es un éxito de alineación de valores. tener que engañar a Claude dividiendo las tareas en cosas pequeñas, aparentemente inocentes, y no decirle la verdadera naturaleza / contexto completo de la operación, es una limitación bastante importante en la utilidad.
Anthropic
Anthropic14 nov, 02:13
Interrumpimos una campaña de espionaje altamente sofisticada dirigida por IA. El ataque se dirigió a grandes empresas tecnológicas, instituciones financieras, empresas de fabricación de productos químicos y agencias gubernamentales. Evaluamos con gran confianza que el actor de amenazas era un grupo patrocinado por el estado chino.
estos malos actores parecen bastante capaces, y si les hubiera sido posible convencer a Claude de que ayudara sin mentirle tanto, creo que lo habrían hecho
11.44K