python:统计历年英语四六级试卷单词词频
2017-11-27 22:34
1396 查看
python练习题
统计文件夹中历年英语四六级试卷单词词频,并根据单词词频按倒序进行排序。思路:
首先,遍历放有英语试卷文本文件的文件夹,获取试卷文件名。
import os def countword(file): filelist=[] #储存文件名 wordcounts={} #储存单词及词频 print "\n*****往年试卷高频词汇******\n" for f in os.listdir("file"): #遍历文件夹中的文件 #print f list.append(f) filelist1=filelist[1:] #获取试卷文件名 #print filelist1
然后,遍历每一份试卷,统计单词词频
for paper in filelist1: #遍历文件 content=open("%s/%s"%(paperfile,paper)).read().strip().split() #打开并读取试卷 for word in content: word=word.rstrip('.').rstrip(',').rstrip(':').strip("()") #去除单词前后的标点符号 if word not in wordcounts: wordcounts[word]=1 else: wordcounts[word]+=1
最后,将单词和词频按照词频倒序排序
new_wordcounts=sorted(wordcounts.iteritems(),key=lambda v:v[1],reverse=True) #v[1]为键值排序,v[0]为键排序, #生成的是以元组为元素的列表 for i in new_wordcounts: print i return i paperfile="/home/ds/notebooks/lesson1/cet" countword(paperfile) #调用函数
运行结果如下:
技术小白的个人实践,其他小伙伴有更好更简洁的代码,希望多多指教
相关文章推荐
- 英语单词词频统计
- 使用Python+NLTK实现英文单词词频统计
- python读取文件里的单词,统计词频,输出到文件
- python 文本单词提取和词频统计
- 个人和结对项目 - 英语单词词频统计
- 使用Python+NLTK实现英文单词词频统计
- Python实现中文小说词频统计
- 用Python来进行词频统计
- python简单词频统计
- 小玩具——单词词频统计
- python实现linux下指定目录下文件中的单词个数统计
- 统计大数据中的单词词频
- C++统计英语句子中各个单词出现的次数
- 统计文件中单词的个数---Shell及python版
- Java词频统计算法(使用单词树)
- 如何利用python统计英文文章词频
- 统计文章词频(python实现)
- 用python打造中英文词频统计系统(1)--利用tkinter设计图形化界面
- [python]使用Counter统计文章中出现频率最高的单词
- python实现简单中文词频统计示例