Python词频统计
2019-08-21 16:55
2341 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_38768811/article/details/99975511
[code]# 词频统计:将每个单词都转换为小写,去掉有些单词后面的标点符号 import string with open("D:/test.txt", 'r', encoding='utf-8') as text: # 用一个列表存储所有的单词 words = [word.strip(string.punctuation).lower() for word in text.read().split()] # 使用set()函数将列表转换为集合,相同的单词只出现一次 words_index = set(words) # 用词典存储每个单词和单词出现的次数 count_dict = {index:words.count(index) for index in words_index} # 写入文件 out_file = open("D:/result.txt","a", encoding='utf-8') for word in sorted(count_dict, key=lambda x: count_dict[x], reverse=True): print("%-20s"% word, count_dict[word], file=out_file)
相关文章推荐
- 【初学python】实例九:词频统计
- python利用多种方式来统计词频(单词个数)
- python进行分词、去停用词和统计词频
- python实现简单中文词频统计示例
- Python进行文本预处理(文本分词,过滤停用词,词频统计,特征选择,文本表示)
- python3结巴分词分行拆分统计词频
- python 文本单词提取和词频统计
- Python使用Hadoop进行词频统计
- Python字典使用--词频统计的GUI实现
- Python开发Spark应用之Wordcount词频统计
- python 统计TXT中的英文词频
- Python 对文本先按词频统计,若相同按字典排序,后取TopN
- 【python技能】词频统计
- 【实例】词频统计及其可视化python+jieba+wordcloud
- 【Python基础】1.2.1 字典统计词频
- python 统计序列中元素的出现频度\统计英文文章的词频
- [置顶] Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图
- python词频统计降序排列BUG
- Python起步之字典案例(词频统计)
- 如何利用python统计英文文章词频