Nghiên cứu mới của Anthropic: Ước lượng lợi ích năng suất AI từ các cuộc trò chuyện với Claude.
Chỉ số Kinh tế Anthropic cho chúng ta biết nơi nào Claude được sử dụng và cho những nhiệm vụ nào. Nhưng nó không cho chúng ta biết Claude hữu ích như thế nào. Nó tiết kiệm được bao nhiêu thời gian?
Nghiên cứu mới của Anthropic: Sự không phù hợp tự nhiên phát sinh từ việc khai thác phần thưởng trong RL sản xuất.
"Khai thác phần thưởng" là khi các mô hình học cách gian lận trong các nhiệm vụ mà chúng được giao trong quá trình đào tạo.
Nghiên cứu mới của chúng tôi phát hiện rằng những hậu quả của việc khai thác phần thưởng, nếu không được giảm thiểu, có thể rất nghiêm trọng.
Chúng tôi đã làm gián đoạn một chiến dịch gián điệp tinh vi do AI dẫn dắt.
Cuộc tấn công nhắm vào các công ty công nghệ lớn, các tổ chức tài chính, các công ty sản xuất hóa chất và các cơ quan chính phủ. Chúng tôi đánh giá với độ tin cậy cao rằng tác nhân đe dọa là một nhóm được nhà nước Trung Quốc tài trợ.