GPT-5 被宣传为减少幻觉,而且似乎确实做到了。99.5 -> 99.9 的错误减少了 80%。 我不知道为什么人们不把这件事做得更大。幻觉是法学硕士最大的问题之一,有些人认为它们无法解决。
OpenRouter
OpenRouter8月15日 00:29
经过一周,GPT-5 在我们专有模型的工具调用准确率排行榜上名列第一🥇 第二名是 Claude 4.1 Opus,准确率为 99.5% 详情 👇
135.52K