Opus 4.5:7.5-8/10 有帮助。 我终于信任这个模型为我写作,它实际上对重要的事情有很好的判断力和品味。 在编码方面,它感觉可以永远工作,而不会像之前的模型那样陷入同样的编码厄运循环。 有些地方仍然不完美:记忆、计算机使用、文档创建、主动性等,但在这些方面有明显的改进方向(这里也需要一些产品用户体验的创新)。 在这一点上,我感觉我们距离接近 10/10 只差几个模型世代。