做大数据分析的怎么可以不会这个?
Overview:
0 引言
1 环境
2 模块准备
3 实现思路
4 小试牛刀
5 中试牛刀
6 总结
0 引言
词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文章的主旨。
1 环境
操作系统:Windows
Python版本:3.7.2
2 模块准备
本文涉及到的Python第三方模块,共计四个:分词模块jieba,文字云模块wordcloud,画图模块matplotlib,用来处理背景图片的模块scipy。这些模块均可通过pip方式进行安装:
模块的导入:
3 实现思路
准备好一份自己需要分析的文本材料,这里选用的是19年两会新鲜出炉的政府工作报告。我们首先得通过jieba模块对文本材料进行分词处理,然后对处理后的材料使用wordcloud文字云模块生成相应的词云图片即可。
当然了你可以选择一个背景图片,并以此为基础生成特定的云图,这时就用到了上面提到的另外两个模块scipy和matplotlib。
好了,思路有了,那就开始实践吧~
4 小试牛刀
小试牛刀章节教你仅用9行代码,来生成一个词云图,先欣赏下最终的效果图。
4.1 效果图
4.2 代码实现
制作云图的思路,上文已作说明,这些就不再赘述了,直接看代码,代码中已添加详细注释说明。
除去注释、导入模块占用的两行,剩下仅7行的代码,你来说说Python强大不?
小试牛刀不够牛?上面做出的云图不够完美?那就继续看下去,这里来实现一个定制图案的云图。
5 中试牛刀
我们这里有一张祖国地图,是否可以定制生成一个祖国版图样式的词云图呢?
答案是肯定的,只因为Python太强大,实现思路直接看代码。
5.1 代码实现
5.2 效果图
6 总结
是不是又被强大的Python给震撼了?如引言所述,通过生成词云图,对文章中出现频率较高的“关键词”予以视觉化的展现,帮助读者快速领略文章的主旨,既方便又高效!
不过呢,不要高兴地太早,这里给大家暗暗地埋了几颗雷,词云图功能强大实用自不必说,但是若想正常的用起来,除了上面提到的在安装wordcloud模块时会遇到麻烦之外,还有更多的麻烦在等着大家。请关注后续Python排错集的系列文章。
关注公众号「Python专栏」,后台回复:zsxq09,获取本文全套代码
- 做大数据分析的怎么可以不会这个?
- 做大数据分析的怎么可以不会这个?
- Cognos做大数据分析也可以棒棒哒
- 学机器学习,不会数据分析怎么行?之NumPy详解
- 腾讯云图片鉴黄集成到C# SQL Server 怎么在分页获取数据的同时获取到总记录数 sqlserver 操作数据表语句模板 .NET MVC后台发送post请求 百度api查询多个地址的经纬度的问题 try{}里有一个 return 语句,那么紧跟在这个 try 后的 finally {}里的 code 会 不会被执行,什么时候被执行,在 return 前还是后? js获取某个日期
- 数据的相似性和相异性我们可以怎么分析
- 学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)
- Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 2)
- 谁说菜鸟不会数据分析
- 数据科学家是怎么用“”加密的“”语言阻碍新手入门的——Data Science 数据分析术语表
- 怎么去分析数据库表的模型(数据模型)
- 零基础学习数据分析路线,学习到什么程度可以找到工作
- 怎么设置可以把dropdown设成可以输入数据
- Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 1)
- 怎么撰写一份优秀的数据分析报告(四)
- 产品经理怎么用好数据分析(一)
- Fiddler怎么对IPhone手机的数据进行抓包分析
- 小白学数据分析----->到底要怎么做流失分析
- 数据分析报告怎么用