2.python连接mongodb,利用微博数据制作云图
2017-12-15 17:40
567 查看
先把使用到的库导进去
连接mongob数据库并完成测试,输出collection中有多少条记录,我用的这个有178万条数据。
获取女性发表的微博内容
使用jieba分词,用WordCloud设置云图的基本属性
这是男生的
利用python的第三方库jieba分词,之后调用WordCloud设置云图的整个属性,奇丑无比,若是想要哦美化,还可以导入一张背景,使得云图展现特定的形状。注意使用总问字体库,否则会出现乱码。
由结果可见:女生更加喜欢购物,玩具,婴儿相关的话题,可以推测发微博比较多的是母亲这一身份。如果想要发展微博粉丝数,可以增加一些有关婴儿健康保护等相关的话题以吸引妈妈们来关注。
下图是男生常谈话题关键词:
由图可见,男生群体主要以大学生为主,其中多有设计暴力事件,整体情况都是比较负面的影响。如果想要吸引男生们的眼球,可以适量增加关于社会安全,网络安全,或者学校小笑话,校园里的故事之类的话题。
import matplotlib.pyplot as plt import jieba from wordcloud import * import pymongo import re
连接mongob数据库并完成测试,输出collection中有多少条记录,我用的这个有178万条数据。
#连接数据库 client = pymongo.MongoClient('localhost',27017) db = client['myDbs'] weibo = db['weibo'] #测试 # print weibo.find().count()
获取女性发表的微博内容
#获取用来制作图云的微博内容,并去除html标签 text_f=weibo.aggregate([{'$project':{'text':1,'_id':0}}]) for item in text_f: text_str = re.sub(r'</?\w+[^>]*>', '', item[u'text']).replace(u'网页链接', '').replace(u'查看全文', '')
使用jieba分词,用WordCloud设置云图的基本属性
#制作云图主程序 wordlist_after_jieba=jieba.cut(text_str) wl_space_split=" ".join(wordlist_after_jieba) my_wordcloud=WordCloud( background_color="red", max_words=200, font_path='/Users/huanghuaixian/不常用/Arial Unicode.ttf', max_font_size=42, random_state=40, scale=1.5, ).generate(wl_space_split) plt.imshow(my_wordcloud) plt.axis("off") plt.show()
这是男生的
利用python的第三方库jieba分词,之后调用WordCloud设置云图的整个属性,奇丑无比,若是想要哦美化,还可以导入一张背景,使得云图展现特定的形状。注意使用总问字体库,否则会出现乱码。
由结果可见:女生更加喜欢购物,玩具,婴儿相关的话题,可以推测发微博比较多的是母亲这一身份。如果想要发展微博粉丝数,可以增加一些有关婴儿健康保护等相关的话题以吸引妈妈们来关注。
下图是男生常谈话题关键词:
由图可见,男生群体主要以大学生为主,其中多有设计暴力事件,整体情况都是比较负面的影响。如果想要吸引男生们的眼球,可以适量增加关于社会安全,网络安全,或者学校小笑话,校园里的故事之类的话题。
相关文章推荐
- python爬虫--连接MongoDB 存数据
- 利用Python爬取微博数据生成词云图片实例代码
- 利用Python数据可视化工具plotly从数据库读取数据制作本地图表应用实例
- python连接mongodb操作数据示例(mongodb数据库配置类)
- python利用mongodb上传图片数据 : GridFS 与 bson两种方式
- python对于mongodb微博数据的操作
- python利用新浪API实现数据的抓取\python微博数据爬虫
- python利用新浪API实现数据的抓取\python微博数据爬虫
- 利用python测试mongodb副本集数据同步延迟
- 利用python测试mongodb副本集数据同步延迟
- 【利用Python进行数据分析——经验篇2】计算微博转发/评论/点赞h指数的Python代码
- python - 利用Pandas对某app数据进行整理、分析并存入mongodb
- Python爬虫,看看我最近博客都写了啥,带你制作高逼格的数据聚合云图
- Python连接mongodb提取部分字段内数据并写入txt文件
- python连接mongodb操作数据示例(mongodb数据库配置类)
- 基于python爬取‘’春雨医生“网站患者提问数据制作数据云图分析患者需求
- python利用wxpython实现ssh连接linux进展
- python实现爬虫数据存到 MongoDB
- 利用python中的pyquery库简单的抓取数据