您的位置:首页 > 其它

数据仓库是什么,主要有哪些特点?

2019-03-23 15:15 1011 查看

面对大数据的多样性,在存储和处理这些大数据时,我们就必须要知道两个重要的技术,其分别为:数据仓库技术、Hadoop。当数据为结构化数据,来自传统的数据源,则采用数据仓库技术来储存和处理这些数据。

数据仓库是指具有主题导向、整合性、长期性与稳定性的数据群组,是经过处理整合,且容量特别大的关系数据库,用以储存决策支持系统所需的数据,供决策支持和数据分析使用。

1.主题导向,满足日常作业需求的信息系统,其重点在于相关的应用软件是否符合业力所需,而为使系统响应时间缩短,其数据库和文件系统的设计常各自独立,且数据内常用重复不一致的现象。就解行业而言,以贷款、放款、或信用卡部门为例,各部门均使用其专属的客户档案,因其含有业务所需的数据字段。

数据仓库的信息系统,其重点在于企业经营时,重要主题组件。同以银行业为例,客户、产品及交易即为重要的主题组件。各应用系统中此三类主题,在通过相关的整合后,便能反映企业的经营状况。

2.具整合性,当确认相关的主题组件后,各应用系统的数据须经过整合,以例执行相关分析作业。例如,数据内容的一致性(以性别为例,男/女、M/F、0/1等;以长度为例cm、m、Feet等;以日期为例,干支纪年、公元年等);数据字段命名的统一;数据属性的统一。另外,为避免数据的重复及不一致的现象,须执行相关正规化的作业,3NF为一可用的数据模式。

3.具长期性,日常性作业的信息系统,受限于软硬件设备的容量及响应时间等因素,常无法保留太长时间的信息(6090天)。而数据仓库系统为了执行趋势分析,常须保110年的历史数据。

4.具少变性,其数据内容常常频繁地存取及异动。当数据从日常性作业的信息系统中转入数据仓库系统后,主要用于大量数据查询及分析,事实上,从忠于原始数据源的角度来看,异动数据仓库的数据,是不合理且不道德的做法。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
大数据主要应用于哪些行业,应用价值是什么?
http://www.duozhishidai.com/article-1195-1.html
大数据应用越来越广泛, 大数据主要应用于哪些领域?
http://www.duozhishidai.com/article-1501-1.html
大数据应用,主要包括哪几种商业模式
http://www.duozhishidai.com/article-12470-1.html

多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: