python 统计词频
2018-01-18 20:02
671 查看
import sys reload(sys) sys.setdefaultencoding("utf-8") #import jieba #import jieba.analyse #wf = open("clean_title.txt", "w+") #for line in open('clean_data.csv'): # item = line.strip('\n\r').split('\t') # tags = jieba.analyse.extract_tags[item[0]] # tagsw = ",".join(tags) # wf.write(tagsw) #wf.close() word_lst = [] word_dict = {} with open('clean_title.txt') as wf,open("word.txt",'w') as wf2: for word in wf: word_lst.append(word.split(',')) for item in word_lst: for item2 in item: if item2 not in word_dict: word_dict[item2] = 1 else: word_dict[item2] += 1 for key in word_dict: print key,word_dict[key] wf2.write(key+' '+str(word_dict[key])+'\n')
相关文章推荐
- Python数据分析之文本处理词频统计
- Python实现中文小说词频统计
- python实战,中文自然语言处理,应用jieba库来统计文本词频
- Python字典使用--词频统计的GUI实现
- Python开发Spark应用之Wordcount词频统计
- 【Python基础】1.2.1 字典统计词频
- python多进程读取大文件并统计词频
- python实现简单中文词频统计示例
- python 中自然语言处理(中文)——统计词频
- 词频统计python
- python jieba分词并统计词频后输出结果到Excel和txt文档
- Python 3.6 利用NLTK 统计多个文本中的词频
- python 统计词频
- python 统计词频
- 一行Python代码统计词频
- python 统计句子中的词频次数
- python:统计历年英语四六级试卷单词词频
- Python由词频统计改编的数据分组汇总
- Python3.5+PyQt5词频统计(一)
- 使用Python+NLTK实现英文单词词频统计