数据项目面临的六大挑战
2013-02-04 14:29
411 查看
企业在实施BI、数据仓库和其他与数据相关的项目时或多或少都会遇到困难。我们将这些挑战分为六个类别:①性能;②数据质量;③集成;④数据定义;⑤安全;⑥架构和管理。
每一个类别在从单份报表到整个数据仓库的使用案例中的重要程度都有所不同。分类没有绝对的标准,它们多多少少出自我个人经验的判断。因此,每个企业都应该有自己不同的看法。
既然如此,是什么定义了这六个类别呢?我们来分析一下:
1. 性能
在实施使用案例的过程中,只有保障充分的性能,才能迅速处理海量数据的查询。
2. 数据质量
在数据管理过程中,让数据一致、完整、零错误非常困难。对于独立的数据集,通过测试可以解决这个问题,但稳定的数据质量仍然难以达到,一般整合了的数据集的质量都比较低。
3. 集成
提到集成,我们通常都会想到SAP BusinessObjects Data Services或Informatica的ETL工具,工作包括整合孤岛数据源、集成非结构化数据和结构化数据,以及将数据上载到报表系统的基本任务。另外,将数据孤岛中的语义概念进行集成也属于这一范畴。例如,“revenue”(具有税收、收益等多重含义)这个单词对你和在别人看来是同一个意思吗?这就得看它的识别规则了,数据也同理。
4. 数据定义
为使用系统数据的用户生成数据定义十分重要。没有定义,数据毫无用处。对于数据专家来说,没有注解的数据集就足够了,正如有些人看一眼数据清单就能了解财务状况或者得出逻辑函数一样;但是,大多数业务人员无法做到这一点。定义的生成工作需要对不同的栏目贴上标签、创建可识别的等级、清晰表现数据的时间点视角和进行视觉探究等。
5. 安全
一般情况下,你不会希望任何信息都是透明的。在面向数据的系统中,不同数据会有不同的权限,这样不同授权的概念往往在分析系统中表现得比交易系统更为明显。
6. 架构和管理
企业到底需要投入多少精力在管理解决方案上?有秩序的架构管理起来更加容易,这是肯定的,因为解决方案的模型和实施方式都是一样的。另外,在技术改变的同时,架构也需要随之改变。从星型模式到单一柱状表格的转换到底有多困难呢?如果模板一样的话就没那么难。
每一个类别在从单份报表到整个数据仓库的使用案例中的重要程度都有所不同。分类没有绝对的标准,它们多多少少出自我个人经验的判断。因此,每个企业都应该有自己不同的看法。
既然如此,是什么定义了这六个类别呢?我们来分析一下:
1. 性能
在实施使用案例的过程中,只有保障充分的性能,才能迅速处理海量数据的查询。
2. 数据质量
在数据管理过程中,让数据一致、完整、零错误非常困难。对于独立的数据集,通过测试可以解决这个问题,但稳定的数据质量仍然难以达到,一般整合了的数据集的质量都比较低。
3. 集成
提到集成,我们通常都会想到SAP BusinessObjects Data Services或Informatica的ETL工具,工作包括整合孤岛数据源、集成非结构化数据和结构化数据,以及将数据上载到报表系统的基本任务。另外,将数据孤岛中的语义概念进行集成也属于这一范畴。例如,“revenue”(具有税收、收益等多重含义)这个单词对你和在别人看来是同一个意思吗?这就得看它的识别规则了,数据也同理。
4. 数据定义
为使用系统数据的用户生成数据定义十分重要。没有定义,数据毫无用处。对于数据专家来说,没有注解的数据集就足够了,正如有些人看一眼数据清单就能了解财务状况或者得出逻辑函数一样;但是,大多数业务人员无法做到这一点。定义的生成工作需要对不同的栏目贴上标签、创建可识别的等级、清晰表现数据的时间点视角和进行视觉探究等。
5. 安全
一般情况下,你不会希望任何信息都是透明的。在面向数据的系统中,不同数据会有不同的权限,这样不同授权的概念往往在分析系统中表现得比交易系统更为明显。
6. 架构和管理
企业到底需要投入多少精力在管理解决方案上?有秩序的架构管理起来更加容易,这是肯定的,因为解决方案的模型和实施方式都是一样的。另外,在技术改变的同时,架构也需要随之改变。从星型模式到单一柱状表格的转换到底有多困难呢?如果模板一样的话就没那么难。
相关文章推荐
- 500px的数据分析之路——中小创业公司零基础数据分析面临的挑战
- 大数据安全:hadoop面临的安全挑战
- 康奈尔大学王飞博士:AI处理医疗数据面临的8大挑战
- 大数据面临的挑战:当大数据遭遇云计算
- 2013年成功实施大数据项目的六大关键
- 全球NB-IoT发展面临六大挑战
- 大数据变革将至 hadoop面临巨大挑战
- 数据显示高考生源持续降 部分高校面临生存挑战
- Web数据挖掘所面临的挑战
- 大数据面临的挑战:当大数据遭遇云计算
- 中国百位CEO调查:企业转型升级面临六大挑战
- 新浪陈尔冬:大数据下Web Server面临的挑战
- 大数据引发的变革与企业面临的挑战
- 业界 | Kaggle问卷主成分分析,16000数据从业者面临这5类挑战
- 浅析传统关系数据库面临大数据的挑战
- 共享经济商业模式的六大优势六大特征与面临的挑战
- 六大值得关注的Apache大数据项目
- 数据共享面临挑战
- 大数据对六大领域的挑战是什么
- 数据、进程-云计算学习笔记---Hadoop简介,hadoop实现原理,NoSQL介绍...与传统关系型数据库对应关系,云计算面临的挑战-by小雨