您的位置：首页 > 编程语言 > Python开发

python 统计词频

2018-01-18 20:02 671 查看

import sys
reload(sys)

sys.setdefaultencoding("utf-8")

#import jieba
#import jieba.analyse

#wf = open("clean_title.txt", "w+")
#for line in open('clean_data.csv'):

#    item = line.strip('\n\r').split('\t')
#    tags = jieba.analyse.extract_tags[item[0]]
#    tagsw = ",".join(tags)
#    wf.write(tagsw)

#wf.close()

word_lst = []
word_dict = {}
with open('clean_title.txt') as wf,open("word.txt",'w') as wf2:
for word in wf:
word_lst.append(word.split(','))
for item in word_lst:
for item2 in item:
if item2 not in word_dict:
word_dict[item2] = 1
else:
word_dict[item2] += 1

for key in word_dict:
print key,word_dict[key]
wf2.write(key+' '+str(word_dict[key])+'\n')

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

Python数据分析之文本处理词频统计
Python实现中文小说词频统计
python实战，中文自然语言处理，应用jieba库来统计文本词频
Python字典使用--词频统计的GUI实现
Python开发Spark应用之Wordcount词频统计
【Python基础】1.2.1 字典统计词频
python多进程读取大文件并统计词频
python实现简单中文词频统计示例
python 中自然语言处理（中文）——统计词频
词频统计python
python jieba分词并统计词频后输出结果到Excel和txt文档
Python 3.6 利用NLTK 统计多个文本中的词频
python 统计词频
python 统计词频
一行Python代码统计词频
python 统计句子中的词频次数
python：统计历年英语四六级试卷单词词频
Python由词频统计改编的数据分组汇总
Python3.5+PyQt5词频统计（一）
使用Python+NLTK实现英文单词词频统计

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航