拥有正确的评估是至关重要的。模型的泛化方式可能是你的评估无法捕捉到的。相反,如果你在相邻维度(比如,规划和测试)进行评估,可能会以你未曾想到的方式产生针对目标驱动问题的突现解决方案(比如创新代码)