python使用wordcloud生成词云(能识别中文)
2017-04-28 18:57
281 查看
# -*- coding: utf-8 -*-
from os import path from PIL import Image import codecs import numpy as np import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS d = path.dirname(__file__) # 当前文件文件夹所在目录 # 读取文件,使用codecs包的open方法指定编码格式,不然读取不到中文 text = codecs.open('event.txt',encoding='utf-8').read() # 读取图片 love_mask = np.array(Image.open(path.join(d, "love.jpg"))) wc = WordCloud(font_path='MSYH.TTF', background_color="white", max_words=2000, mask=love_mask, stopwords=STOPWORDS.add("")) # 生成词云 wc.generate(text) # 保存为文件 # wc.to_file(path.join(d, "love.png")) # 显示图 plt.imshow(wc) plt.axis("off") plt.show()
我的event1.txt是已经处理过的文字,大家在使用时可能需要先用jieba分词来处理一下文本。
原图如下:
效果图如下:
相关文章推荐
- 使用python生成word的中文字体
- 关于python使用wordcloud生成繁体字词云的方法
- Python 中使用 ogr 生成 shape 文件时的中文乱码问题
- 使用Stanford CoreNLP的Python封装包处理中文(分词、词性标注、命名实体识别、句法树、依存句法分析)
- python图像上面字符的识别之tesseract—OCR和中文包的下载使用
- Latex中使用dvipdfm转换方式hyperref包生成PDF中文书签乱码的解决方案
- 使用python查询中文汉字的Unicode
- 彻底解决使用Doxygen 1.5.6自动生成的chm文件导航栏中文乱码问题
- 如何使用iReport 和jasper生成报表(SQL传参数及中文文件名)
- python源码中使用中文注释
- [Python]Pydev中使用中文
- 使用Python生成树形图案
- 使用doxygen为C/C++程序生成中文文档(上)
- Python之中文识别
- 使用FreeMarker生成静态页面,解决中文乱码问题源码
- Python中使用中文的方法
- python 的方法不能使用中文
- Python中使用中文
- Python MySQLdb 使用utf-8 编码插入中文数据
- Python源代码中使用中文的方法