Facebook Data Freeway : Scaling Out to Realtime
2011-07-14 16:58
567 查看
我的一些想法:从以下数据来看,Facebook的SLA明确提出了有不超过0.01%的数据丢失。分布式平台要做到像Oracle/DB2之类的100%的数据安全性保证是几乎不可能的,而且互联网产品通超都能容忍微量数据的丢失。==========================================================
这是Facebook工程师Eric Hwang和Sam Rash在HadoopSummit 2011上的一个Topic。在这个topic中,分享的一些关于Facebook的数据:5亿+活跃用户
5000w用户每天至少更新一条状态信息
每月上传超过10亿张照片
每周分享超过10亿份内容
每秒产生超过7GB数据
以及Facebook对于实时数据处理系统的SLA:每秒支撑10~15GB的数据生成
没有单点失效的问题
只运行不超过0.01%的数据丢失(也就说需要99.99%的数据可靠性)
99%的数据要求延时少于10s(一般情况下2s)
在PPT的后半部分,则简单的介绍了Facebook的数据高速公路,包括Scribe,Calligraphus,HDFS,ZooKeeper等,以及他们的实时分析平台Puma(使用HBase做为数据持久化方案)。2011 06-30-hadoop-summit v5View more presentations from Sam Rash
这是Facebook工程师Eric Hwang和Sam Rash在HadoopSummit 2011上的一个Topic。在这个topic中,分享的一些关于Facebook的数据:5亿+活跃用户
5000w用户每天至少更新一条状态信息
每月上传超过10亿张照片
每周分享超过10亿份内容
每秒产生超过7GB数据
以及Facebook对于实时数据处理系统的SLA:每秒支撑10~15GB的数据生成
没有单点失效的问题
只运行不超过0.01%的数据丢失(也就说需要99.99%的数据可靠性)
99%的数据要求延时少于10s(一般情况下2s)
在PPT的后半部分,则简单的介绍了Facebook的数据高速公路,包括Scribe,Calligraphus,HDFS,ZooKeeper等,以及他们的实时分析平台Puma(使用HBase做为数据持久化方案)。2011 06-30-hadoop-summit v5View more presentations from Sam Rash
相关文章推荐
- How to plot line chart with Real-time data at Dialog-base application?
- How to read out WhatsApp messages with Tasker and react on their content in real time
- DataTime.ToString("xx") 转换
- Oracle Golden Gate 系列十七 -- GG 一对多 real-time data distribution 说明 与 示例
- How to implement realtime periodic tasks in Linux applications
- MPAndroidChart 教程:动态和实时数据 Dynamic & Realtime Data(八)
- Applying Sampling Theory To Real-Time Graphics
- big data for realtime
- Oracle Golden Gate 系列十七 -- GG 一对多 real-time data distribution 说明 与 示例
- jenkins console outout is not realtime
- mongodb启动服务失败:Hotfix KB2731284 or later update is installed, no need to zero-out data files
- How to Access Stock Quotes Realtime through Google Finance
- DataSift Architecture: Realtime Datamining At 120,000 Tweets Per Second
- 诡异的DataTime.Now.ToString()
- define a static method to convert datatime to a formatted string with uesr-defined
- Data Formatters temporarily unavailable, will re-try after a 'continue'. (Not safe to call dlopen at this time.)
- Oracle Golden Gate 系列十七 -- GG 一对多 real-time data distribution 说明 与 示例
- Real-time model scoring for streaming data – a prototype based on Oracle Stream Explorer and Oracle
- DataTime or ToString用法
- Apache Hadoop Goes Realtime at Facebook(中文,Hadoop在脸谱达成实时应用)