overfitting-过拟合
2017-01-16 00:00
387 查看
过拟合:模型在测试集上的效果表现很好,在训练集上的效果与在训练集上的效果差异很大,这种情况就是发生了过拟合。
过拟合是过度拟合的训练集中的数据。
1、由于样本量不足,训练样本的分布于测试样本之间的分布存在差异。
2、在样本量不足的情况下,训练模型时,令代价函数等于零(极端),使得模型的泛化性能很差,导致了过拟合。
处理过拟合的方法
(1)正则化,就是在在模型中考虑模型复杂度,同时考虑经验风险和模型复杂度,预防过拟合。
(2)交叉验证,就是将训练集和测试集来回使用,反复训练验证。一般分为简单交叉验证,S折交叉验证,留一交叉验证。
(3)增加样本的全面性和数量;
(4)控制模型的复杂度;
(5)不要过度训练
(6)模型融合本质上也是一种提高泛化能力的方法
NG:
训练集误差与交叉验证集误差近似时:偏差/欠拟合
交叉验证集误差远大于训练集误差时:方差/过拟合
参考:[1] http://lib.csdn.net/article/machinelearning/33798
[2] NG视频
过拟合是过度拟合的训练集中的数据。
1、由于样本量不足,训练样本的分布于测试样本之间的分布存在差异。
2、在样本量不足的情况下,训练模型时,令代价函数等于零(极端),使得模型的泛化性能很差,导致了过拟合。
处理过拟合的方法
(1)正则化,就是在在模型中考虑模型复杂度,同时考虑经验风险和模型复杂度,预防过拟合。
(2)交叉验证,就是将训练集和测试集来回使用,反复训练验证。一般分为简单交叉验证,S折交叉验证,留一交叉验证。
(3)增加样本的全面性和数量;
(4)控制模型的复杂度;
(5)不要过度训练
(6)模型融合本质上也是一种提高泛化能力的方法
NG:
训练集误差与交叉验证集误差近似时:偏差/欠拟合
交叉验证集误差远大于训练集误差时:方差/过拟合
参考:[1] http://lib.csdn.net/article/machinelearning/33798
[2] NG视频
相关文章推荐
- (八)Tensorflow学习之旅——理解过拟合overfitting
- 深度学习 14. 深度学习调参,CNN参数调参,各个参数理解和说明以及调整的要领。underfitting和overfitting的理解,过拟合的解释。
- overfitting(过度拟合)的概念
- 数据挖掘: overfitting 过拟合情况 整理
- Machine Learning- overfitting (Andrew Ng 课程总结-过拟合)
- 机器学习中:过拟合(overfitting)和欠拟合(underfitting)
- 用简单易懂的语言描述过拟合 overfitting?
- overfitting(过度拟合)的概念
- 局部加权回归、欠拟合、过拟合(Locally Weighted Linear Regression、Underfitting、Overfitting)
- (过拟合及其防治)Overfitting and Its Avoidance
- 14过拟合(Overfitting)
- overfitting(过度拟合)的概念
- 数据量多少与训练的过拟合和欠拟合 overfitting and underfitting
- 过度拟合(overfitting)
- overfitting(过度拟合)的概念
- 用简单易懂的语言描述过拟合 overfitting?
- 正则化(Regularization)、过拟合(Overfitting)
- 深度学习 14. 深度学习调参,CNN参数调参,各个参数理解和说明以及调整的要领。underfitting和overfitting的理解,过拟合的解释。
- Tensorflow Overfitting过拟合解决方法 Dropput()使用方法
- 听课笔记(第十三讲): 过拟合 - Overfitting (台大机器学习)