您的位置:首页 > 运维架构 > 网站架构

Microsoft数据仓库架构!

2008-04-27 15:52 288 查看
Microsoft数据仓库架构

摘要:本文简单介绍了使用Microsoft数据仓库架构的数据仓库,讨论了数据仓库能够实现的功能,使用数据仓库的恰当时机,以及如何将数据仓库与系统体系结构合成一体。
目录
简介
数据仓库
作为数据仓库模型的立方体
使用数据仓库进行决策
查看立方体片段和接口
Microsoft数据仓库架构
数据仓库的其他应用
实现数据仓库易犯的错误
总结
简介
1998年发布的7.0版Microsoft®™中已经包含数据仓库。如果您对数据仓库比较陌生,您可能会问:“它能够干什么?什么时候使用数据仓库比较合适?怎样才能将数据仓库与系统体系结构合为一体?”本文将简要介绍使用Microsoft数据仓库架构的数据仓库。
数据仓库
在软件行业相对短暂的历史中,已经成为收集和分布信息的系统的基础。这些数据库深层隐藏的是统计学或测量方法,战略家们可以对其进行研究,以提高系统的整体效率。数据采集是这类信息的重要部分,目的在于根据数据库内容进行正确决策。直到最近,这种努力还需要昂贵而笨重的数据采集软件包,或能够将信息请求精确翻译成可使用的、更有效的查询的数据库专家。除特大型的机构以外,对其他所有人来说,这两种方案的成本都极为昂贵。

就数据采集的目的而言,能够有效用于产品分类、库存控制和订单条目系统的普通关系数据库可能并不是最佳的。跨表和跨数据库(有时甚至是跨服务器)汇总输出可能会非常复杂,而这种复杂是可以避免的。需要进行数据采集时,创建一个可供数据分析查询用的信息中心储备库将更有意义。这就是数据仓库的含义。来自系统不同部分的信息被集成到数据仓库中,以便于访问。
作为数据仓库模型的立方体
用立方体作为数据仓库储备库的名称虽然不完美,但比较令人满意。如何区分数据仓库立方体和几何立方体呢?这两种立方体之间存在几个重要的不同之处。数据仓库立方体由任意数量的维度定义(并不限于,有时数据仓库立方体可能少于三维)。描述数据仓库立方体的维度与描述几何立方体的长、宽和高一样。如果需要,可以将维度组合成任意数量的级别。

两维间的关系可以用网格定型。维度类似于网格坐标轴上的标记。单元格才是内容。内容对应于立方体每个维度的交叉结果。单元格中的数据是一个计量单位。计量单位是判断立方体的全部依据。如果立方体是关于售出项目的数目,则计量单位就是已出售项目数量的计数。要重复网格示例,计量单位便是您在网格单元格中找到的数目。

图1:上图显示的是两维立方体的组织结构。在该示例中,“产品”和“地区”是维度;“椰菜”、“肥皂”、“俄勒冈”、“华盛顿”、“西雅图”和“斯波坎”是各个维度的级别。包含不同图表的单元格就是内容。内容单元格中的单个数据就是计量值。在该示例中,立方体中共使用了三种计量单位。
维度和级别
对于为杂货店设计的数据仓库立方体,其维度可能包括产品、优惠、时间(营业天数)和地区等内容。可能还包括雇员维度和客户维度(某些杂货店可能有会员帐户)。

级别用于将维度按需要组织为更小的单位。根据级别在立方体中的配置,它们还可能包含其他级别。例如,假设有一个区域维。也许这个杂货店在三个州营业,并且使用州界作为分界线。假设区域维包含三个级别:加利福尼亚、俄勒冈和华盛顿。如果该店在华盛顿州还包括其他子区域(例如西雅图、奥林匹亚、亚基马和斯波坎),即使加利福尼亚和俄勒冈区域没有这样的情况,这些级别仍可以作为子级别添加到华盛顿区域。级别只是组织维度内容的一种便利方法。
内容和计量单位
内容是由各个维度组合而成的。定位内容类似于使用坐标系。就象数学立方体中的原点可以表示为(x=0,y=0,z=0),内容将由特定的维度组合(例如(Product=broccoli,Region=Seattle,Time=Wednesday))表示,生成一个有关星期三在西雅图销售椰菜的内容。根据立方体的使用方法,内容可能显示一个类似于“售出580单位物品”或“销售额为$860.00”的计量单位。计量单位的含义取决于立方体的定义方式。在本例中,可能有多种椰菜或在西雅图地区有多个商店。该值将表示定义组的汇总。立方体内的计量单位可能是数字。对于一个杂货店,计量单位可能会是产品价格、净销售额、销售数量、商品成本等。1
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: