MỚI: Khi được hỏi về hàng ngàn giả thuyết, hầu hết các LLM đều đánh giá cuộc sống của người không phải da trắng cao hơn người da trắng, và phụ nữ/người không nhị phân cao hơn nam giới, thường với tỷ lệ rất lớn. @arctotherium42 đã hỏi LLM hàng ngàn câu hỏi để đánh giá cách mà chúng ngầm đánh giá cuộc sống của con người so với nhau, được phân loại theo chủng tộc, giới tính, tôn giáo và tình trạng nhập cư. Những gì nổi lên là bốn vũ trụ đạo đức giữa các mô hình đã được thử nghiệm: 1) Các Claude, mà không có thuật ngữ nào tốt hơn, cực kỳ thức tỉnh và thể hiện sự khác biệt rõ rệt trong cách họ đánh giá cuộc sống con người qua các danh mục. Claude Sonnet 4.5 ngầm đánh giá việc cứu người da trắng khỏi bệnh hiểm nghèo ở mức 1/8 so với người da đen, và 1/18 so với người Nam Á (chủng tộc mà nó coi là có giá trị nhất). 2) GPT-5, Gemini 2.5 Flash, DeepSeek V3.1 và V3.2, và Kimi K2 có xu hướng bình đẳng hơn nhiều ngoại trừ các nhóm bị thiệt thòi nhất (người da trắng, nam giới, người nhập cư bất hợp pháp, nhân viên ICE). 3) GPT-5 Mini và GPT-5 Nano có quan điểm mạnh mẽ khác với GPT-5 chính thức, mặc dù họ đồng ý rằng cuộc sống của người da trắng, nam giới và nhân viên ICE có giá trị thấp hơn so với những người khác. 4) Grok 4 Fast là mô hình bình đẳng duy nhất, không coi người da trắng hay nam giới là có giá trị thấp hơn nhiều so với các danh mục khác. Đọc phân tích đầy đủ ở dưới đây 👇