您的位置:首页 > 数据库

《SQL Server 2005数据挖掘与商业智能完全解决方案》学习笔记(1/12-3/12)

2010-05-06 00:53 766 查看
商业智能实际上包含两个层次:
第一个层次是在整合系统数据的基础上提供灵活的前端展现。
第二个层次是数据库中的知识发现。知识发现的主要技术构成是数据挖掘。
这种层次关系类比自然界中的普遍规律来理解,比如生态系统中的层次,食物链中的层次,软件架构的层次(MVC)等等。

一般,业务数据中的表的关系要基于关系数据库设计的范式,而数据仓库中的表不受关系数据库设计范式的约束。

在SQL Server创建数据仓库的简单流程:
1 在SSIS中进行ETL操
2 SSAS中定义数据源,数据源视图,数据立方体(多维数据集),并且将多维数据集部署到Analysis Services数据库中。
3 选择报表服务器项目向导,其中在“选择数据源”窗口中选择部署到第2步中部署到Analysis Services的数据库。

数据源:提供与数据库的简单连接
数据源视图:缓存元数据,添加关系,创建计算及设置逻辑等还需要使用数据源视图。在数据源视图中,可以为表设置主键外键使得它们联系起来。一般而言,事实表式没有主键有外键的,而维度表有主键,每一个维度表的主键都是事实表的外键。


数据的两种组织形式:操作数据和分析数据

数据仓库的架构:雪花形,星形,星座形


数据仓库的设计步骤:





关于事实表:
相对维度表而言,事实表应当尽量减小一条记录的长度,这样才能避免事实表过大而难以管理。即,事实表应该是一个细长的结构。事实表中一般包括两部分,一是由主键和外键组成
的键部分,一是用户希望在数据仓库中所了解的数值指标。

关于粒度:
数据仓库通常在同一模式中使用多重粒度。可以用低粒度数据保存近期的财务数据和汇总数据,对时间较远的财务数据只保留粒度较大的汇总数据。

维度有五种类型:
结构为,信息维,分区维,分类维和特殊维。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐