要完美理解一个现象,就是要完美压缩它,拥有一个无法再简化的模型。 如果一个深度学习模型需要数百万个参数来建模某个可以用三个项的微分方程描述的事物,那么它并没有真正理解它,只是缓存了数据。