NLP的特征工程及数据预处理的分类
2019-07-13 16:14
323 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Lzj000lzj/article/details/95761090
cleaning
大小写同一
解码
去特殊符号
修剪单词内部的错误符号
tokenizing
tokenize
N-Grams
skip-grams
char-grams
remove
清除停用词,稀有单词
roots
修剪单词的前几个字符
修正单词回词根
相关文章推荐
- 数据预处理 | 机器学习之特征工程
- 数据预处理、特征工程和特征学习
- 平均数编码:针对高基数定性特征(类别特征)的数据预处理/特征工程
- 平均数编码:针对高基数定性特征(类别特征)的数据预处理/特征工程
- 数据预处理 特征工程 之库sklearn-pandas
- 机器学习02-使用python中的sklearn库进行数据的预处理(数据的特征工程)
- 机器学习里数据预处理及特征工程总结
- 特征工程与数据预处理
- 机器学习 数据特征分析 特征工程
- 《Spark机器学习》笔记——Spark高级文本处理技术(NLP、特征哈希、TF-IDF、朴素贝叶斯多分类、Word2Vec)
- 机器学习sklearn之数据预处理及特征选择
- 机器学习之金融信贷风控(二)申请评分卡中的数据预处理和特征衍生(未完待续)
- 机器学习——特征工程之数据预处理
- 机器学习入门:特征工程与数据降维
- 机器学习中的数据清洗与特征工程
- <转>Spark MLlib 数据预处理-特征变换(二)
- 特征工程——特征分类及不同类特征的处理方式
- 特征工程(三) 数据标准化和归一化
- 机器学习-Python实践Day4(特征工程--数据特征选定)
- (三)申请评分卡中的数据预处理和特征衍生(下)