您的位置:首页 > 其它

【sklearn】数据预处理(一)

2017-03-11 15:35 183 查看
一般来说,我们搜集到的数据因为种种原因都会出现缺失值,通常而言,我们有几种常见的解决方法,一种解决方法是直接去掉这些包含缺失值的行,不得不说这样的做法或多或少会影响到我们的后续的数据分析,特别是对数据量小的情况。因此我们要采用更好的策略来填充缺失的数据,例如通过已知的数据来推测。

Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。



缺失值也可以使用0来表示:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: