驾驭大数据第七章部分内容
2014-04-18 13:07
155 查看
原著:Bill Franks
第七章标题 what makes great analysis
译文:
7.1分析与报告
许多组织认为分析与报告是一回事。这种观点看起来好像对,我们在深入讨论一下。报告很重要并且很有价值。如果报告准确无误,那么价值将会增加。但是报告有它的局限性,我们必须知道这个局限性是什么。
总的来说,一个组织要想在大数据方面有所成就,报告和分析都不能少,这一结论是显然的,正如二者已经在之前其它数据源上发挥很大作用一样。关键问题是搞清楚报告和分析的区别。另外,还需要搞清楚二者的共同之处。如果没有搞清楚,你的组织会在这方面吃亏的。
*****************************************************************************************************
思想是分析之父
分析可生成报告,报告也可生成分析。大多情况下是,由报告生成分析。例如,你可能有十个报告在桌子上,把握他们中的关键信息,总结出你的新发现,并搞清楚这意味着什么。这就是分析。正是人们投入到数据和统计中的思想、思考创造了分析。没有解释的数据和统计是没用的。
*****************************************************************************************************
7.1.1报告
让我们先来给报告下个定义。报告环境常被称为商业智能(BI)环境。正是在这种环境中,使用者选择他们想要运行的报告,执行它并且查看结果。这样的报告或许会包含表、图、表格或他们的结合。定义报告的关键因素包括:
报告能够反馈使用者要求的数据
数据将以标准的,固定的格式呈现
在生成报告的过程中,除了通过报告界面请求报告的那个使用者外,没有
其他人参与.(我们假定报告模块已经被创造和部署)
结果,报告相当不灵活
我们澄清一下最后一点。复杂的报告模块可以被多种提示(prompts)和筛选(filters)创造。在这样的报告中,很可能有多种观点,但是有了那些预定义选项的限制后,他们变得相当不灵活。一般使用者很难生成新报告,或者分解检查那些预定义的提示和筛选是怎样工作的。使用者可能简单地填充那些已经到位的提示和筛选。
不恰当使用报告的一种情况是:手头上有大量可用的报告,但误以为他们是大量可用的分析。有一种现象在许多组织中很常见。管理商业智能环境的IT人员会说,“我们有世界一流的BI环境。我们有500多个可用的报告,他们可以覆盖任何商业部分,任何人的需求。我们的商务人员拥有他们想要的一切”
同时,商务使用者会说,“太失望了!我们花费一两年时间来建造这个报告系统,但我依然没有得到我需要的。”如果商务人员和IT人员走到一个屋里面,会话往往是这样开始的:商务人员抱怨他们没有得到自己需要的。IT人员会说,“你们真是疯了!有500个可用报告还不够吗?”。最终导致双方相互指责。
分离源于下面的事实:好像埋藏在500份报告中的东西才是商务人员所需要的。但当报告多达500份报告时,他们很难从中找出自己想要的。另外,任何两个人都希望用不同的想法看待同一件事情。每一个商务人员都希望在报告上有一个额外的度量标准,或者用一种不同的方式去组织报告。或许会有500份报告摆在那里,但是没有一份是任何商务人员想要的。
*****************************************************************************************************
在报告中,尺寸不重要
许多IT组织致力于建立尽可能多并且尽可能覆盖所有话题的报告。这可能受到商务人员的如下行为所驱使:他们提交覆盖他们所有可能用到的一切的请求,而不是他们需要并且会用到的。结果,商务人员收到各种各样的报告,然而得不到他们想要的。将焦点放到提供关联紧密的有限的报告。不要掉进下面这个陷阱:认为拥有最多报告的那个人会获得胜利!
*****************************************************************************************************
与创造500各种类型的报告相比,提供少量满足终端使用者需求的报告要好很多。重要的是报告的相关性,而不是报告的数量。然而通常情况是,人们更多的关注报告数量而不是相关性。正如我们接下来要讨论的那样,即使拥有了所有商业报告的完美组合,仍然不会提供分析。这只是分析过程中所需的一些数据而已。
有的时候我们不需要对报告进行深入分析。例如,假定你有一个包含每周每周产品的销售报告,并且你想知道你的产品是否达到了他们的上周销售目标。通过操作这个报告,答案很快就呈现在你面前,也就没有作进一步工作或者分析的必要了。这是报告增加价值的一种方式。它们能够快速简洁地回答常见问题。如果一切顺利,那么就没有作进一步工作的必要。如果某些事情看起来与期望不符,那么再做进一步工作。
7.1.2分析
定义了报告之后,我们来定义分析。由此,我们便可比较和对比两者。定义分析的关键点是:
分析提供问题的答案。
分析过程进行许多必要的步骤来得到问题的答案。
因此,分析是为特定的问题而制定的。
分析需要一个指导分析过程的人。
分析过程是灵活的
分析大概就是说:“我知道了问题。我将结合一切需要的知识去解决这个问题。”这是一个相互作用的过程:一个人处理一个问题、找到获得答案所需的数据、分析那些数据,并且,还需要解释结果以便为行动提供建议。分析与报告的区别总结在表7.1中。
表7.1
报告与分析之间的相互影响与相互作用很常见,也是有必要的。事实上,每一个都会使另外一个更有效。例如,考虑这样一种情形,一个销售经理拿着一份基础销售总结报告,这份报告显示了地区月销售情况。这个报告很简单,销售经理看了每一天的情况,那么他将对经济是否正常运转有个大概感觉。直到有一天,他看到一些极为不寻常的东西以至于他自己都搞不懂。于是,他走到大厅,集合了分析小组,告诉他们销售总结报告上有一些奇怪的事情。销售经理要求他们深入挖掘,搞清楚到底发生了什么。他的这个基于报告的要求酿成一个分析,而这正是应该做的事情。
另一方面,讨论一下分析师怎样解决这个问题。他检查、鉴别问题的深层原因是什么。过了一会儿,她回来了,并向销售经理展示了它的发现。经理或许会说,她刚才整理得到的数据真是太有用了。
刚才发生了什么?她对一个问题的分析导致了一个新的报告标准。她是自己所做的事情自动化,更进一步,这成为了一个标准报告。
当你的组织试图驯服大数据时,一个伟大的分析可能会这样被创造:把你所拥有的数据以一种不同的方式、为了新的的目标而分解。这是用一种前所未有的方式来看待经济。分析师们做的大量工作可能不令人感到兴奋,它们通常以分析前的数据准备和做大量简单的计算为起点。
*****************************************************************************************************
分析的价值在于用不同的方式看待数据
分析的关键点不是将问题复杂化。有时一个简单的分析就会提供所有的答案。以不同的方式看待数据常常会产生给力的观点。
*****************************************************************************************************
在一个问题变得清晰前通常没有必要太fancy。价值在于用不同的方式做事情,而不是做一些fancy的事情。例如,或许在销售链上出现了销售反常的情况。一个解决方案是建立一个复杂的预测模型,这个模型只旨在决定是什么东西造成了哪些反常。然而,第一步首先是看看供应链上是否出现问题。也许是运输延误了或者恶劣的天气导致消费者躲在家中。如果可以找的类似起因,那就没必要建立一个fancy模型。你已经通过一个简单的分析找到了原因,好了,可以到此为止了。
7.1.3分析:让它有指导性、相关性、可解释性、可行性、及时性
若要使分析,那么一定要将他做好。为了能使一个分析能够增加价值,需要把大量的因素集中起来。伟大分析和无效分析的区别是什么呢?伟大分析符合指导性、相关性、可解释性、可行性、及时性。下面让我们简要说明一下
指导性
一个伟大的分析会被经济需求所指导。分析的完成不仅仅是因为它很有趣。伟大分析总是同一个专门的商业问题关联的。一旦要进行,分析将会被解决问题所需要的东西所指导。分析的每一步都应该为解决问题的需要而设置。
相关性
显然,一切伟大的分析必须同商业相关。这并不意味着随便选择一个商业问题。选择的问题应该是这样的:商业觉得需要一个解决方案,并且商业有能力解决这个问题。
可解释性
一个伟大的分析需要有效的解释,这对基于此的行动来说很有必要。技术细节可能会成为分析是有效的证据,结果需要以一种决策者可以理解和消化的方式解释出来。一个伟大的分析,是可以解释的,容易被决策者利用。
可行性
一个伟大的分析是可行的。它会指向这样的步骤,这个步骤就是用来利用结果来改进业务的。如果公司绝对不会将一些商店移动到一公里以外,那么我们的分析上就不应该有类似建议。如果没有能力去实现,那么分析也只能是无稽之谈。
及时性
一个伟大的分析需要及时提交,这样才能在需要在作出决定时随时可用。如果一个问题需要下周解决,那么下个月才给出答案将无济于事。一个分析可能会在各个方面十分完美,但是不能及时完成,以至于不能支持决策。如果是这样的话,寻找另一个问题,把精力用到那上面去。一个迟到的分析不是伟大的分析。
第七章标题 what makes great analysis
译文:
7.1分析与报告
许多组织认为分析与报告是一回事。这种观点看起来好像对,我们在深入讨论一下。报告很重要并且很有价值。如果报告准确无误,那么价值将会增加。但是报告有它的局限性,我们必须知道这个局限性是什么。
总的来说,一个组织要想在大数据方面有所成就,报告和分析都不能少,这一结论是显然的,正如二者已经在之前其它数据源上发挥很大作用一样。关键问题是搞清楚报告和分析的区别。另外,还需要搞清楚二者的共同之处。如果没有搞清楚,你的组织会在这方面吃亏的。
*****************************************************************************************************
思想是分析之父
分析可生成报告,报告也可生成分析。大多情况下是,由报告生成分析。例如,你可能有十个报告在桌子上,把握他们中的关键信息,总结出你的新发现,并搞清楚这意味着什么。这就是分析。正是人们投入到数据和统计中的思想、思考创造了分析。没有解释的数据和统计是没用的。
*****************************************************************************************************
7.1.1报告
让我们先来给报告下个定义。报告环境常被称为商业智能(BI)环境。正是在这种环境中,使用者选择他们想要运行的报告,执行它并且查看结果。这样的报告或许会包含表、图、表格或他们的结合。定义报告的关键因素包括:
报告能够反馈使用者要求的数据
数据将以标准的,固定的格式呈现
在生成报告的过程中,除了通过报告界面请求报告的那个使用者外,没有
其他人参与.(我们假定报告模块已经被创造和部署)
结果,报告相当不灵活
我们澄清一下最后一点。复杂的报告模块可以被多种提示(prompts)和筛选(filters)创造。在这样的报告中,很可能有多种观点,但是有了那些预定义选项的限制后,他们变得相当不灵活。一般使用者很难生成新报告,或者分解检查那些预定义的提示和筛选是怎样工作的。使用者可能简单地填充那些已经到位的提示和筛选。
不恰当使用报告的一种情况是:手头上有大量可用的报告,但误以为他们是大量可用的分析。有一种现象在许多组织中很常见。管理商业智能环境的IT人员会说,“我们有世界一流的BI环境。我们有500多个可用的报告,他们可以覆盖任何商业部分,任何人的需求。我们的商务人员拥有他们想要的一切”
同时,商务使用者会说,“太失望了!我们花费一两年时间来建造这个报告系统,但我依然没有得到我需要的。”如果商务人员和IT人员走到一个屋里面,会话往往是这样开始的:商务人员抱怨他们没有得到自己需要的。IT人员会说,“你们真是疯了!有500个可用报告还不够吗?”。最终导致双方相互指责。
分离源于下面的事实:好像埋藏在500份报告中的东西才是商务人员所需要的。但当报告多达500份报告时,他们很难从中找出自己想要的。另外,任何两个人都希望用不同的想法看待同一件事情。每一个商务人员都希望在报告上有一个额外的度量标准,或者用一种不同的方式去组织报告。或许会有500份报告摆在那里,但是没有一份是任何商务人员想要的。
*****************************************************************************************************
在报告中,尺寸不重要
许多IT组织致力于建立尽可能多并且尽可能覆盖所有话题的报告。这可能受到商务人员的如下行为所驱使:他们提交覆盖他们所有可能用到的一切的请求,而不是他们需要并且会用到的。结果,商务人员收到各种各样的报告,然而得不到他们想要的。将焦点放到提供关联紧密的有限的报告。不要掉进下面这个陷阱:认为拥有最多报告的那个人会获得胜利!
*****************************************************************************************************
与创造500各种类型的报告相比,提供少量满足终端使用者需求的报告要好很多。重要的是报告的相关性,而不是报告的数量。然而通常情况是,人们更多的关注报告数量而不是相关性。正如我们接下来要讨论的那样,即使拥有了所有商业报告的完美组合,仍然不会提供分析。这只是分析过程中所需的一些数据而已。
有的时候我们不需要对报告进行深入分析。例如,假定你有一个包含每周每周产品的销售报告,并且你想知道你的产品是否达到了他们的上周销售目标。通过操作这个报告,答案很快就呈现在你面前,也就没有作进一步工作或者分析的必要了。这是报告增加价值的一种方式。它们能够快速简洁地回答常见问题。如果一切顺利,那么就没有作进一步工作的必要。如果某些事情看起来与期望不符,那么再做进一步工作。
7.1.2分析
定义了报告之后,我们来定义分析。由此,我们便可比较和对比两者。定义分析的关键点是:
分析提供问题的答案。
分析过程进行许多必要的步骤来得到问题的答案。
因此,分析是为特定的问题而制定的。
分析需要一个指导分析过程的人。
分析过程是灵活的
分析大概就是说:“我知道了问题。我将结合一切需要的知识去解决这个问题。”这是一个相互作用的过程:一个人处理一个问题、找到获得答案所需的数据、分析那些数据,并且,还需要解释结果以便为行动提供建议。分析与报告的区别总结在表7.1中。
报告 | 分析 |
提供数据 | 提供答案 |
提供要求的东西 | 提供需要的东西 |
标准化 | 自定义化 |
不涉及人 | 涉及人 |
相当不灵活 | 十分灵活 |
报告与分析之间的相互影响与相互作用很常见,也是有必要的。事实上,每一个都会使另外一个更有效。例如,考虑这样一种情形,一个销售经理拿着一份基础销售总结报告,这份报告显示了地区月销售情况。这个报告很简单,销售经理看了每一天的情况,那么他将对经济是否正常运转有个大概感觉。直到有一天,他看到一些极为不寻常的东西以至于他自己都搞不懂。于是,他走到大厅,集合了分析小组,告诉他们销售总结报告上有一些奇怪的事情。销售经理要求他们深入挖掘,搞清楚到底发生了什么。他的这个基于报告的要求酿成一个分析,而这正是应该做的事情。
另一方面,讨论一下分析师怎样解决这个问题。他检查、鉴别问题的深层原因是什么。过了一会儿,她回来了,并向销售经理展示了它的发现。经理或许会说,她刚才整理得到的数据真是太有用了。
刚才发生了什么?她对一个问题的分析导致了一个新的报告标准。她是自己所做的事情自动化,更进一步,这成为了一个标准报告。
当你的组织试图驯服大数据时,一个伟大的分析可能会这样被创造:把你所拥有的数据以一种不同的方式、为了新的的目标而分解。这是用一种前所未有的方式来看待经济。分析师们做的大量工作可能不令人感到兴奋,它们通常以分析前的数据准备和做大量简单的计算为起点。
*****************************************************************************************************
分析的价值在于用不同的方式看待数据
分析的关键点不是将问题复杂化。有时一个简单的分析就会提供所有的答案。以不同的方式看待数据常常会产生给力的观点。
*****************************************************************************************************
在一个问题变得清晰前通常没有必要太fancy。价值在于用不同的方式做事情,而不是做一些fancy的事情。例如,或许在销售链上出现了销售反常的情况。一个解决方案是建立一个复杂的预测模型,这个模型只旨在决定是什么东西造成了哪些反常。然而,第一步首先是看看供应链上是否出现问题。也许是运输延误了或者恶劣的天气导致消费者躲在家中。如果可以找的类似起因,那就没必要建立一个fancy模型。你已经通过一个简单的分析找到了原因,好了,可以到此为止了。
7.1.3分析:让它有指导性、相关性、可解释性、可行性、及时性
若要使分析,那么一定要将他做好。为了能使一个分析能够增加价值,需要把大量的因素集中起来。伟大分析和无效分析的区别是什么呢?伟大分析符合指导性、相关性、可解释性、可行性、及时性。下面让我们简要说明一下
指导性
一个伟大的分析会被经济需求所指导。分析的完成不仅仅是因为它很有趣。伟大分析总是同一个专门的商业问题关联的。一旦要进行,分析将会被解决问题所需要的东西所指导。分析的每一步都应该为解决问题的需要而设置。
相关性
显然,一切伟大的分析必须同商业相关。这并不意味着随便选择一个商业问题。选择的问题应该是这样的:商业觉得需要一个解决方案,并且商业有能力解决这个问题。
可解释性
一个伟大的分析需要有效的解释,这对基于此的行动来说很有必要。技术细节可能会成为分析是有效的证据,结果需要以一种决策者可以理解和消化的方式解释出来。一个伟大的分析,是可以解释的,容易被决策者利用。
可行性
一个伟大的分析是可行的。它会指向这样的步骤,这个步骤就是用来利用结果来改进业务的。如果公司绝对不会将一些商店移动到一公里以外,那么我们的分析上就不应该有类似建议。如果没有能力去实现,那么分析也只能是无稽之谈。
及时性
一个伟大的分析需要及时提交,这样才能在需要在作出决定时随时可用。如果一个问题需要下周解决,那么下个月才给出答案将无济于事。一个分析可能会在各个方面十分完美,但是不能及时完成,以至于不能支持决策。如果是这样的话,寻找另一个问题,把精力用到那上面去。一个迟到的分析不是伟大的分析。
相关文章推荐
- 多表查询内连接与外连接的区别;多表之间内连接;(常用)(只连接两个表都有效数据); 多表之间的外连接:(查询所有的内容); 多表内连接:(显示和隐式结果是一样的,得到的是交集的部分)
- 亚马逊 MWS上传数据 API部分的相关内容 amazon api 文档
- mysql替换字段里数据内容部分字符串
- sql语句更新某字段内容中部分数据
- mysql使用REPLACE替换字段里数据内容部分字符串
- 驾驭文本部分内容总结
- 信息架构本质,第 1 部分: 数据和内容的两难抉择
- gridview 绑定数据为空时,表头部分内容显示的解决方法
- 第七章 跨内容共享数据,探究内容提供器
- 【数据结构与算法】 利用哈夫曼树进行文件压缩 (部分借鉴网上内容)
- 第二行代码学习笔记——第七章:跨程序共享数据——探究内容提供器
- mysqlDump 导出多表,其中部分表有限制数据内容
- 第二部分:高级抓取(第七章、清理脏数据)
- 第七章 跨程序共享数据-探究内容提供器
- mysql替换字段里数据内容部分字符串(亦可用于增加字段中的内容)
- 数据模型所描述的内容包括三个部分:数据结构、数据操作、数据约束。
- 使用数据2分处理的通用分页存储过程 前半部分与后半部分数据访问时间相同
- Laxcus大数据管理系统2.0(9)- 第七章 分布任务组件
- 加载数据时先显示小圆圈不显示内容
- ORACLE:大数据update(部分转载)