您的位置:首页 > 大数据

如何利用Watson Analytics进行数据探索

2016-06-01 15:15 399 查看

引言

本文内容正式开始之前,先插播一则新闻。Watson Analytics的新版本v2已经正式发布上线了。大家可以通过本文最后的试用链接进行注册试用。值得注意的是,新版本除了和以前一样提供免费版试用之外,还提供了专业版的30天试用许可。Watson Analytics专业版允许接入更多种类的数据源,处理更大量的数据,使用更大的存储空间,还可以连接社交媒体数据等等。欢迎有兴趣的朋友来尝鲜。

上期文章《如何使用Watson Analytics获取更优质的数据》告诉大家,Watson Analytics可以自动获取数据,并对数据质量评分,便于用户轻松评估数据质量,并进行数据优化。本期文章我们会介绍,如何利用这些经过优化的数据,更快速、自动化地进行数据探索,以便更敏捷的获取业务价值。

数据探索到业务洞察

Watson Analytics是一款基于云平台的自动化智能数据探索工具,它可以快速开启您的数据探索之旅。它的智能自动化分析能力能够助您加速获得您关注的业务问题的答案。它还可以帮您以故事的形式将分析洞察呈献出来。较之业界以往其它的分析工具,都需要通过手工数据加工、处理来获得分析洞察的方法,您现在可以完全将注意力放在业务理解及与同伴有效协作、沟通之上,数据加工、图形展示、可视化呈献的事情完全交给Watson Analytics来做就好。甚至,您只需要以自然语言的方式简单输入您的业务问题,Watson Analytics就会立即以可视化的综合分析结果来阐述业务问题的答案了。当然,您还可以在这些页面上进行交互操作,调整您的分析展现,获得最终的业务问题分析结论。

Watson Analytics可以自动分析您的数据,并以提问的方式供用户选择。
您可以使用自然语言提出您关于数据的问题。
您可以基于已有的分析结果进行深入探索,挖掘更多的业务洞察。
这里给大家提供一个Watson Analytics试用版,有兴趣的朋友可以试试!

示例体验

下面我们通过一个实际的例子体会Watson Analytics的数据探索能力。

1. 登录Watson Analytics(您可以通过本文最后章节的试用链接注册,并得到免费试用版本)。

2. 加载数据。

这次我们还是选择上期文章使用的数据集American Time Use Survey data set。这是来自美国劳工部的关于美国劳工时间使用统计的一个数据集。

如下图所示,红框中的图标即是已经加载的数据。我们可以看到系统对这个数据集的综合评分为62分。



3. 创建数据探索。

单击上图红框中的数据集,可以看到:



您可以看到下方的红框内,系统自动分析出一些分析结果供用户参考。比如按年度分析不同种类工时的发展趋势,按年份、工作状态的分析劳工小孩的个数、年龄范围的决定因素等等。这些业务问题在您提问之前就已经由Watson Analytics准备好并放在您眼前了。

您可以通过点击您关心的业务问题,以全屏方式展现分析结果。例如我们点击第二个业务主题“按年和雇员的雇佣状态分析小孩的个数”。如下图所示。



上图红色方框内的条件都是可以修改的,便于分析人员根据自己的分析思路探索问题的答案。从上图我们可以观察到无业人员拥有小孩的个数要多于在职人员。

现在,我们还可以对这个分析图形进行调整,比如我把统计日期限定在2012年,只需要将下方的数据里的Year字段对2012过滤即可。然后我们将雇员状态修改为年龄段(Age Range),则可以得到下图。



显然,我们发现,美国人在20岁之前及30~39之前的小孩子是最多的,特别是20岁之前。看来美国人还真是生小孩比较早。

同时,Watson Analytics还提供了自然语言输入对话框,以帮助您向数据提问。简单输入一个问题就会生成一系列分析图表供您选择。如下图所示,我首先单击图中的“+”号新建了一个数据探索页面,并在对话输入框内输入:How do the values of Children compare by Age?则可以得到下面的柱状图形。由下图可知,美国人在15、6岁时拥有的小孩数量最多,平均约有2个小孩。看来美国人早婚早育的情况比较常见。



为了便于业务人员更加灵活的进行数据探索,Watson Analytics除了提供推荐的可视化图形之外,还提供了多种可视化图形供用户选择,包括比较流行的气泡图、树图、标签云、决策树、刻度盘、热图、地图、网络图、螺旋图等等。



并且对每种可视化图形,系统也提供了更为精细的图形选项供用户定制。



待分析页面设计完成后,单击页面右上角的分享图标,就可以通过下图中的几种方式将分析页面共享给其它同伴了。您可以通过电子邮件、下载、Tweet、链接等方式进行结果的分享。



您也可以将您的分析页面保存到云端,以备下次分析察看使用。



看过我们上期文章的朋友,一定记得如何对数据进行优化。其实我们在这个新版本里,在数据探索的同一页面内,也可以进行数据优化操作了。如下图所示。



结束语

心动不如行动!感兴趣的朋友可以体验一下Watson Analytics的魅力吧。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息