您的位置:首页 > 编程语言 > Python开发

python 使用sklearn计算TF-IDF权重

2016-12-02 18:11 281 查看
1.通过os.listdir()函数获取指定目录下的文件名list

2.对文件使用jieba进行分词并提取topK作为关键词

3.使用sklearn计算每一个文本中所有关键词的权重(文本中没有的词权重为0)

4.参考链接:

http://blog.csdn.net/zhzhl202/article/details/819710

http://www.it165.net/pro/html/201407/17648.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 文本分类 TF-IDF