您的位置:首页 > 运维架构 > 网站架构

企业数据平台仓库架构建设思路

2016-07-21 21:49 781 查看
1.仓库建设原则

(1)自上而下+自下而上。

(2)高容错性

(3)数据质量监控贯穿整个数据流程

(3)不怕数据冗余,利用存储换易用

总体思路-》模型设计-》数据架构=》数据治理

维度建模OR实体关系建模

减少层次结构的目的是为了压缩整体数据处理流程的长度,扁平化的数据处理流程有助于数据质量控制和数据运维。

当前的数据应用方向会起来越关注数据的时效性,越实时的数据越有价值。

需求驱动。

结构化数据采集:

(1)全量采集(2)增量采集(3)实时采集

非结构数据特征提取:

(1)语音转文本(2)图片处理(3)自然语言处理(4)图片打标(5)视频识别

数据服务化:

(1)统计服务(2)分析服务(3)标签服务

实用的点:

(1)巧用虚拟节点(2)强制分区(3)计算框架应用(4)优化关键路径

数据不再是一个边缘性的东西,数据的质量越来越重要。

合理的数据生命周期要保证温热数据占整个数据体系大部分。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: