您的位置:首页 > 其它

构建数据仓库的基本步骤

2017-10-05 15:48 239 查看
确定主题

确定数据分析的主题.eg:分析某年某月某地区的各种啤酒销售情况.

主题要体现出某一方面的各个分析维度和统计量度之间的关系.

确定度量

度量是分析的技术指标,一般为数值型数据.eg:某地区某派出某粒度所发生的警情积分值

确定分析粒度

采用”最小粒度原则”来满足度量的不同聚合程度.eg:将时间粒度精确到秒可以满足小时,天,周….等不同粒度的度量值

确定维度表

分析主题的各个维度.eg:主题:分析某年某月某地区的各种啤酒销售情况.

则维度应该有时间维 , 地域维 , 产品维 .基于不同维度,可以看到各种不同维度的度量值.

确定事实表

将原始数据表和各个维度表进行关联,生成事实表.

ps:考虑到数据源存在脏数据,在关联时候应该使用外连接.将各个维度的代理键存放到事实表中.另外,度量值将由粒度对源数据进行聚合来得到.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据仓库