预处理时如何处理类别型特征
2019-01-09 16:51
85 查看
1.序号编码: 比如成绩的优,良,及格,不合格可以编码成4,3,2,1
2.one-hot(独热)编码:优(1,0,0,0),良(0,1,0,0),及格(0,0,1,0),不合格(0,0,0,1)
3.二进制编码:优—>100(对应于十进制的4),良—>011,及格—>010,不合格—>001
相关文章推荐
- 数据预处理:标称型特征的编码和缺失值处理
- Lightgbm如何处理类别特征?
- 智融集团CTO齐鹏详析:AI如何处理金融领域的弱特征数据?丨CCF-GAIR 2017
- 数据分析预处理的方法——SPSS、Clementine如何处理缺失值、离群值、极值?
- 转自美团技术:机器学习中的数据清洗与特征处理综述&实例详解机器学习如何解决问题
- WebMaster如何处理网站内容重复?
- C++new失败后如何处理
- (转)处理上百万条的数据库如何提高处理查询速度
- 归一化数值--处理数据(使所有特征在同一量级,同等重要)
- 团队开发中,如何处理一个站点不同Web应用通用Session
- Hadoop MapReduce中如何处理跨行Block和inputSplit
- 如何处理Java里的DOM异常
- C++编译器如何处理静态成员
- 机器学习中的数据清洗与特征处理综述
- 复制代码如何处理前面的行号
- 如何进行特征选择
- Shell如何处理ip校验
- Flink 原理与实现:如何处理反压问题
- 教你如何迅速秒杀掉:99%的海量数据处理面试题
- 不可重现的bug如何处理