机器学习中训练集、验证集(开发集)、测试集如何划分
2017-08-31 14:17
375 查看
1.传统的机器学习领域中,由于收集到的数据量往往不多,比较小,所以需要将收集到的数据分为三类:训练集、验证集、测试集。也有人分为两类,就是不需要测试集。
比例根据经验不同而不同,这里给出一个例子,如果是三类,可能是训练集:验证集:测试集=6:2:2;如果是两类,可能是训练集:验证集=7:3。因为数据量不多,所以验证集和测试集需要占的数据比例比较多。
2.在大数据时代的机器学习或者深度学习领域中,如果还是按照传统的数据划分方式不是十分合理,因为测试集和验证集用于评估模型和选择模型,所需要的数据量和传统的数据量差不多,但是由于收集到的数据远远大于传统机器学习时代的数据量,所以占的比例也就要缩小。比如我们拥有1000000,这么多的数据,训练集:验证集:测试集=98:1:1。如果是两类,也就是相同的道理。
注意:有些人在把数据分类的时候是没有测试集数据,这样并不是十分合理,有测试集比较放心,建议把数据分类最好有这个数据集,也就是分为三类数据哈。
比例根据经验不同而不同,这里给出一个例子,如果是三类,可能是训练集:验证集:测试集=6:2:2;如果是两类,可能是训练集:验证集=7:3。因为数据量不多,所以验证集和测试集需要占的数据比例比较多。
2.在大数据时代的机器学习或者深度学习领域中,如果还是按照传统的数据划分方式不是十分合理,因为测试集和验证集用于评估模型和选择模型,所需要的数据量和传统的数据量差不多,但是由于收集到的数据远远大于传统机器学习时代的数据量,所以占的比例也就要缩小。比如我们拥有1000000,这么多的数据,训练集:验证集:测试集=98:1:1。如果是两类,也就是相同的道理。
注意:有些人在把数据分类的时候是没有测试集数据,这样并不是十分合理,有测试集比较放心,建议把数据分类最好有这个数据集,也就是分为三类数据哈。
相关文章推荐
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中的训练集、验证集和测试集
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中,如何利用训练集&测试集来判断 方差(varience)& 偏差(bias)
- 机器学习中训练集、验证集和测试集的作用
- 【七】机器学习之路——训练集、测试集及如何划分
- 机器学习中的训练集,验证集及测试集的关系
- 为什么要划分训练集、验证集、测试集?
- [机器学习] 训练集(train set) 验证集(validation set) 测试集(test set)
- 机器学习数据集划分-训练集,验证集,测试集
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习 数据挖掘 数据集划分 训练集 验证集 测试集
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中训练集、验证集和测试集的关系
- 机器学习: 训练集、验证集、测试集关系
- [机器学习]划分训练集和测试集的方法
- 深度学习tips-训练集、开发集和测试集
- 机器学习----训练集、验证集、测试集
- 【转】[综] 训练集(train set) 验证集(validation set) 测试集(test set)
- 训练集(train set) 验证集(validation set) 测试集(test set)