Chapter 19、Takeaways: Basic error analysis
小贴士:基本误差分析
- 当你开始一个新项目时,尤其是在一个你不是专家的领域,很难正确猜测出最有前景的方向。
- 所以,不要在开始试图设计和构建一个完美的系统。相反,应尽可能快(可能在短短几天内)的构建和训练一个基本系统。然后使用错误分析去帮助你识别最有前景的方向,并从那迭代地改进你的算法。
- 通过手动检查约100个算法错误分类的开发集样本来执行错误分析,并计算主要的错误类别。用这些信息来确定优先修正哪种类型的错误。
- 考虑将开发集分为手动检查的 Eyeball 开发集和不手动检查的 Blackbox 开发集。如果在 Eyeball 开发集上的性能比在 Blackbox 开发集上好很多,那么你已经过拟合 Eyeball 开发集,并且应该考虑为其获得更多的数据。
- Eyeball 开发集应该足够大,以便于算法有足够多的错分类样本供你分析。对很多应用来说,含有1000-10000个样本的 Blackbox 开发集已足够。
- 如果你的开发集不够大到可以按照这种方式进行拆分,那么就使用 Eyeball 开发集来用于手动错误分析、模型选择和调超参。