python 统计 英文 单词
2013-10-16 21:37
537 查看
import sys, os, re def count_words(text): # !num !char -> ' ' text = re.sub("\W+", " ", text) # number -> ' ' text = re.sub("[0-9]", " ", text) # shrink whitespace text = re.sub("\s+", " ", text) return text.count(' ') def getfiletext(file): file = open(file, 'rb') textb = file.read() file.close() # ignore gbk textb = textb.decode('gbk', 'ignore').encode('utf-8') # bytes -> str text = bytes.decode(textb, 'utf-8') return text def main(): for argv in sys.argv[1:]: #print(argv) print (count_words(getfiletext(argv))) if __name__ == "__main__": main()
最近开始SSS阅读法,想看自己看过多少英文单词了,心血来潮用python写了个
主要利用 正则 替换,不是很准确,特别有乱码的时候,精度99.9%吧
反正是大概,无所谓啦
相关文章推荐
- 布同 统计英文单词的个数的python代码
- 布同 统计英文单词的个数的python代码
- 统计英文单词的个数的python代码
- Python每日练习 05 任一个英文的纯文本文件,统计其中的单词出现的个数
- 使用Python+NLTK实现英文单词词频统计
- Python 统计一个纯英文文件中的单词总个数
- python实现统计汉字/英文单词数的正则表达式
- 任意一个英文的纯文本文件,统计其中的单词出现的个数(shell python 两种语言实现)
- 如何用Python实现任一个英文的纯文本文件,统计其中的单词出现的个数?
- 每天一个小程序之python实现统计英文单词出现个数
- 分类统计一句英文里的单词数python
- 统计英文单词的个数的python代码 及 字符串分割
- 使用Python+NLTK实现英文单词词频统计
- [Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)
- Python统计一个英文文档中各单词出现的行数
- Python练手项目4 -- 统计英文单词的数目
- Python实现统计英文单词个数及字符串分割代码
- python实现统计汉字/英文单词数的正则表达式
- 每天一个python小程序 004:任一个英文的纯文本文件,统计其中的单词出现的个数
- Python实现统计英文单词个数及字符串分割代码