您的位置:首页 > 其它

第13课:Spark Streaming 源码解读之Driver 容错安全性

2016-05-22 15:44 204 查看
第13课:SparkStreaming 源码解读之Driver 容错安全性
 

    Driver端的容错包括ReceivedBlockTracker,JobGenerator,DStreamGraph三个层面的容错,这三者对于Driver端的元数据的容错至关重要。

本期概览:

、ReceivedBlockTracker从元数据容错层面谈driver容错

2、JobGenerator,DStreamGrapgh从业务逻辑级别和业务物理执行级别谈driver容错

 

    Driver容错安全性是从Spark Streaming自已的运行机制的角度考虑,例如:对元数据运行方面采用的WAL方式,对自已调度逻辑或自已驱动层面容错安全------主要是采用checkpoint方式,以上两种层面容错在生产环境之下是足足不够的。

   本节讲解 Driver容错以本身的容错机制出发进行解析的。

一、接下来,我们首先进入ReceivedBlockTracker的源码部分,它是管理Receiver 接受的数据的元数!是数据层次的容错。



 


二、Dstream是数据逻辑层面的容错,JobGenerator是数据生成Job层面的容错,这两者统称为调度层面的容错,具体源码请自已进入源码详解查看!

作者:大数据技术研发人员:谢彪

资料来源于:DT_大数据梦工厂(Spark发行版本定制) 

DT大数据梦工厂微信公众号:DT_Spark 

新浪微博:http://www.weibo.com/ilovepains

王家林老师每晚20:00免费大数据实战

YY直播:68917580

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: