第132课: Spark Streaming源码经典解读系列之七:Executro容错工作内幕源码解密
2016-06-27 20:47
281 查看
第132课: Spark Streaming源码经典解读系列之七:Executro容错工作内幕源码解密
Executor 容错高可用:
备份方式
1、备份:将数据拷贝一份,不同机器A/B两个进程复制一份副本,进程级别。
2、使用WAL备份方式,内存的数据挂掉,通过WAL恢复数据。
不备份的方式:
1、重放,从hdfs上重新读取数据,spark streaming可从kafka中读取数据。
2、忽略掉丢失的数据,不在意丢失1%的数据。使用适配器模式,构造一个空数据的集合,有无数据对计算结果无影响。RDD感知不到数据的变化。
这样运行不报错。
Executor 容错高可用:
备份方式
1、备份:将数据拷贝一份,不同机器A/B两个进程复制一份副本,进程级别。
2、使用WAL备份方式,内存的数据挂掉,通过WAL恢复数据。
不备份的方式:
1、重放,从hdfs上重新读取数据,spark streaming可从kafka中读取数据。
2、忽略掉丢失的数据,不在意丢失1%的数据。使用适配器模式,构造一个空数据的集合,有无数据对计算结果无影响。RDD感知不到数据的变化。
这样运行不报错。
相关文章推荐
- I/O多路复用之select,poll,epoll的区别
- 请实现一个算法,在不使用额外数据结构和储存空间的情况下,翻转一个给定的字符串(可以使用单个过程变量)。 给定一个string iniString,请返回一个string,为翻转后的字符串。保证字符串的
- GibbsLDA strtokenizer.cpp分析
- 通过Yum更新MongoDB 2.6 to 3.0
- 设计模式之单例模式
- 网络爬虫(5)--小实战
- redis 持久化
- leetcode 链表总结
- 软件设计的开发关闭原则
- QPainterPath 不规则提示框(二)
- 5-2 打印多层金字塔(明天)
- Javascript是单线程的深入分析
- 最长公共子序列
- 树的统计
- iOS 数据持久化方式 - 归档 反归档
- 设计模式之命令模式
- 二叉树的遍历
- Objective-C中的布尔类型
- Spark,Hello World
- Java异常处理和设计