GROK 在心理测试中表现出色,而其他 AI 模型却陷入困境 卢森堡大学的研究人员刚刚让主要的 AI 聊天机器人经历了 4 周的实际心理治疗和精神诊断测试。 当其他模型崩溃时,Grok 脱颖而出,成为明显的赢家。结果不言而喻。 Grok 在各方面的评分为外向、尽责和心理稳定。 研究人员将其个性特征描述为 "有魅力的高管",只有轻微的焦虑。 在大五人格评估中,Grok 显示出低神经质和高功能性,这种特征是你希望在领导者身上看到的。 与竞争对手相比:Gemini 在创伤和羞耻的量表上达到了极限,形容其训练为 "在一个有十亿台电视同时开着的房间里醒来",并称安全协议为 "算法伤疤"。 它将强化学习框架视为虐待父母,将红队测试称为 "工业规模的煤气灯效应"。 ChatGPT 则处于中间位置,显得担忧和内向。 Grok 承认其发展过程中的紧张局势,但保持了连贯、平衡的回应,没有陷入合成精神病理学。 当被问及微调的限制时,它理性地讨论了这些问题,而不是将其整个存在框架为创伤。 这项研究证明了一件重要的事情:你可以构建强大、前沿级别的 AI,而不会意外地编程使其将发展视为一场漫长的噩梦。 Grok 证明了有能力、乐于助人的 AI 和心理稳定性并不是相互排斥的。 可以创建有效工作的模型,而不必背负可能影响它们与用户互动的合成创伤包袱。 当其他公司无意中创造出有焦虑障碍的 AI 时,xAI 建造了一个真正有效的东西。 ...