使用Python 进行豆瓣评论分析遇到问题总结
2018-04-19 16:42
225 查看
通过微信公众号推送 看到一遍很感兴趣的文章 现在由于大数据的流行 python语言也变得流行起来,通过python技术抓取网页数据,讲数据进行分析
这个例子是通过python将影评中的高频词汇提取出来 同图片显示
本人电脑配置 Windows10 + python 3.5.2
安装python pip ipython ipython notebook 等工具
IPython与IPython Notebook安装及使用 安装组件 参考本博客
http://blog.csdn.net/qq_37423198/article/details/76180905
运行 cmd 控制台输入ipython notebook 启动notebook
看到控制台输出一个浏览器的访问地址 选择地址 粘贴到浏览器打开
进入之后 新建python3 文件 下载好stopwords.txt simhei.ttf
文档要upload在 notebook 上
按照
https://segmentfault.com/a/1190000010473819
文章一步步的 Run 一下
编译到最后一步
# 用词云进行显示
wordcloud = WordCloud(font_path="simhei.ttf", background_color="white", max_font_size=80)
word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}
word_frequence_list1 = []
word_frequence_list2 = []
for key in word_frequence:
# temp = (key,word_frequence[key])
word_frequence_list1.append(key)
word_frequence_list2.append(word_frequence[key])
# word_dict
word_dict = zip(word_frequence_list1, word_frequence_list2)
word_dict = dict((name, value) for name, value in word_dict)
wordcloud = wordcloud.fit_words(word_dict)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
最后一步代码要用这个 自己再根据报错调试一下 阅读更多
这个例子是通过python将影评中的高频词汇提取出来 同图片显示
本人电脑配置 Windows10 + python 3.5.2
安装python pip ipython ipython notebook 等工具
IPython与IPython Notebook安装及使用 安装组件 参考本博客
http://blog.csdn.net/qq_37423198/article/details/76180905
运行 cmd 控制台输入ipython notebook 启动notebook
看到控制台输出一个浏览器的访问地址 选择地址 粘贴到浏览器打开
进入之后 新建python3 文件 下载好stopwords.txt simhei.ttf
文档要upload在 notebook 上
按照
https://segmentfault.com/a/1190000010473819
文章一步步的 Run 一下
编译到最后一步
# 用词云进行显示
wordcloud = WordCloud(font_path="simhei.ttf", background_color="white", max_font_size=80)
word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}
word_frequence_list1 = []
word_frequence_list2 = []
for key in word_frequence:
# temp = (key,word_frequence[key])
word_frequence_list1.append(key)
word_frequence_list2.append(word_frequence[key])
# word_dict
word_dict = zip(word_frequence_list1, word_frequence_list2)
word_dict = dict((name, value) for name, value in word_dict)
wordcloud = wordcloud.fit_words(word_dict)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
最后一步代码要用这个 自己再根据报错调试一下 阅读更多
相关文章推荐
- 使用opencv_python进行视频分析遇到的bgsegm问题
- hadoop使用pig进行数据分析时遇到的问题(10020号端口问题,连接拒绝)
- [python] 2、python使用pyaudio进行录音,及其在python虚拟环境virtualenv中安装遇到的问题
- 使用loadrunner进行压力测试遇到的问题总结
- 使用css进行网页排版中遇到的一些问题总结
- iOS开发工具-如何使用网络封包分析工具Charles,通过配置proxy对http、https、tcp、udp 等协议的请求响应过程交互信息进行分析、判断、解决我们移动开发中的遇到的各种实际问题。
- Android下使用DatagramPacket进行局域网通信遇到的问题和分析
- Emacs使用anaconda-mode进行Python补全时遇到的问题
- python数据分析:charts使用中遇到的问题
- 使用Mencoder进行视频转换遇到的问题和相关解决方案
- 在使用Struts的过程中也遇到了一些问题,现在总结一下
- 使用文件进行优化 分类: python 小练习 divide into python python基础学习 2014-01-01 14:13 228人阅读 评论(0) 收藏
- 使用spotligh+sqltuning+loadrunner对数据库性能问题进行定位和分析
- 使用Entity Framework时遇到的各种问题总结
- 使用JAVA进行MD5加密后所遇到的一些问题
- 公司开发时候,使用svn进行版本控制,在提交代码的时候应该注意的问题,总结!!!!
- SVN在windows上使用check-case-insensitive.py遇到的问题(Python2.5,svn1.5.4)
- Python使用Pygtk和Py2exe打包遇到的问题
- python使用遇到的问题
- Maven_Python打包遇到的问题总结