【sklearn】数据预处理(一)
2017-03-11 15:35
183 查看
一般来说,我们搜集到的数据因为种种原因都会出现缺失值,通常而言,我们有几种常见的解决方法,一种解决方法是直接去掉这些包含缺失值的行,不得不说这样的做法或多或少会影响到我们的后续的数据分析,特别是对数据量小的情况。因此我们要采用更好的策略来填充缺失的数据,例如通过已知的数据来推测。
Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。
缺失值也可以使用0来表示:
Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。
缺失值也可以使用0来表示:
相关文章推荐
- 使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- sklearn-数据预处理
- matlab、sklearn 中的数据预处理
- 【原】关于使用Sklearn进行数据预处理 —— 缺失值(Missing Value)处理
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 数据预处理(3) ——数据归约 使用python(sklearn,pandas,numpy)实现
- 数据预处理(2) ——数据变换与数据离散化 使用python(sklearn,pandas,numpy)实现
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 机器学习中的数据预处理(sklearn preprocessing)
- 预处理数据的方法总结(使用sklearn-preprocessing)
- 数据预处理(1) ——数据清洗 使用python(sklearn,pandas,numpy)实现
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- sklearn-数据预处理-特征变换
- Python: sklearn库中数据预处理函数fit_transform()和transform()的区别