您的位置:首页 > 运维架构

Data Mustering

2011-11-30 18:37 288 查看
Monash Research的一个Blog提出了这个新词

Muster:召集(军队),点名儿

以下是Monash的解释:

“从源自不同地方的数据合到一起备用”(使用方式可能是分析或者操作),表达这个意思的词原本可以是“聚集 Aggregation”或者“收集 Collection”,无奈以上两个词都被数据管理领域作为专有名词占用了,就算是“Marshalling”,也有了特定的含义,所以,可以试试“Mustering” 这个词。

Data Mustering的含义至少包含以下三种场景:

1. 整合的(关系型)数据仓库

2. 海量Bit(字节)桶

3. 海量Bit(字节)流

第一项术语是最早由Teradata引入的,用来表达真正意义上的数据仓库,而不是以前很多所谓的EDW,其实本质上仅仅是一个Data Mart(数据集市)

第二项术语的含义是:用户收集所有的数据(通常是机器产生的很多种Log数据),汇总到一个系统中,管理上通常是使用类似Hadoop这样的开源系统,哦,忘记讲了,数据需要增量式的管理

时下,有很多并不是那么廉价的“Bit桶”解决方案(价格和使用成本),例如,Hadoop Appliances,Splunk和MarkLogic,在诸多提供商里面,Cloudera和IBM是那种为标准Hadoop提供专有升级、改制服务的公司

第三项术语表示数据流引擎上的多个数据流聚合,典型的产品是Sybase提出来的CEP(复杂事件平台),应用在传统的经济型分析和资本市场,还有很多其他流式系统提供商也确认这种场景

最后,“Mustering”是一个军事上用的词,表示集合军队用于检阅或者开拔。

原文:http://www.dbms2.com/2011/11/28/terminology-data-mustering/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息