Python数据预处理—训练集和测试集数据划分
2020-01-14 17:55
211 查看
使用sklearn中的函数可以很方便的将数据划分为trainset 和 testset
该函数为sklearn.cross_validation.train_test_split,用法如下:>>> import numpy as np >>> from sklearn.cross_validation import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> X array([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) >>> list(y) [0, 1, 2, 3, 4]
>>> X_train, X_test, y_train, y_test = train_test_split( ... X, y, test_size=0.33, random_state=42) ... >>> X_train array([[4, 5], [0, 1], [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3], [8, 9]]) >>> y_test [1, 4]
其中 test_size是样本占比,如果是整数的话就是样本的数量; random_state是随机数的种子,不同的种子会造成不同的随机采样结果,相同的种子采样结果相同。
参考: http://blog.sina.com.cn/s/blog_6a90ae320101a5rc.html http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html
转载于:https://www.cnblogs.com/zhanglianbo/p/5701009.html
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- Python数据预处理—训练集和测试集数据划分
- python 将数据随机分为训练集和测试集
- 5.sklearn之转换器(说白了就是,划分训练集和测试集、以及标准化、归一化数据)
- #使用python处理分割数据集,并按比例随机划分训练集与测试集
- python 把数据分成训练集和测试集
- python 划分数据集为训练集和测试集
- 【cl】预处理&划分测试集、训练集
- 用python将一个数据文件分为训练集和测试集
- python 划分数据集为训练集和测试集的方法
- Sklearn中的数据划分方法(划分训练集与测试集)
- python中如何实现将数据分成训练集与测试集
- Python数据预处理(包括处理数据离散值和归一化,分开处理训练集与测试集)
- python中如何实现将数据分成训练集与测试集的方法
- 数据的划分——训练集,验证集,测试集
- python交叉验证以及将全部数据分类训练集和测试集(分类)
- 训练集、验证集、测试集的划分方法
- Python数据预处理:去除非数字类型的字符
- 为什么要划分训练集、验证集、测试集?
- python数据预处理之数据标准化的几种处理方式使用场景
- 关于python 在神经网络训练图像数据预处理时使用的transpose