您的位置:首页 > 其它

NLP的特征工程及数据预处理的分类

2019-07-13 16:14 323 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/Lzj000lzj/article/details/95761090

cleaning

大小写同一

解码

去特殊符号

修剪单词内部的错误符号

tokenizing

tokenize

N-Grams

skip-grams

char-grams

remove

清除停用词,稀有单词

roots

修剪单词的前几个字符

修正单词回词根

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: