Spark Streaming总结-----学习笔记
2018-03-23 20:51
411 查看
支持多种数据源:Kafka、Flume、HDFS、普通TCP套接字等;
基本原理:实时输入数据流以时间片(秒级)为单位进行拆分,然后经Spark引擎以类似批处理的方式处理每个时间片数据;
Spark Streaming最主要的抽象是DStream(Discretized Stream,离散化数据流),表示连续不断的数据流。在内部实现上,Spark Streaming的输入数据按照时间片(如1秒)分成一段一段的DStream,每一段数据转换为Spark中的RDD,并且对DStream的操作都最终转变为对相应的RDD的操作;
Spark Streaming和Storm最大的区别:
Spark Streaming:Storm
毫秒级 ---------------秒级
低延时引擎(100ms+)---xxx
RDD天生高容错-------xxxx
兼容批处理、实时处理------实时处理
方便历史数据和实时数据联合分析------实时分析
基本原理:实时输入数据流以时间片(秒级)为单位进行拆分,然后经Spark引擎以类似批处理的方式处理每个时间片数据;
Spark Streaming最主要的抽象是DStream(Discretized Stream,离散化数据流),表示连续不断的数据流。在内部实现上,Spark Streaming的输入数据按照时间片(如1秒)分成一段一段的DStream,每一段数据转换为Spark中的RDD,并且对DStream的操作都最终转变为对相应的RDD的操作;
Spark Streaming和Storm最大的区别:
Spark Streaming:Storm
毫秒级 ---------------秒级
低延时引擎(100ms+)---xxx
RDD天生高容错-------xxxx
兼容批处理、实时处理------实时处理
方便历史数据和实时数据联合分析------实时分析
相关文章推荐
- Spark学习笔记(19)Spark Streaming架构设计和运行机制大总结
- spark-streaming学习笔记总结
- Spark学习笔记 --- SparkStreaming 实现对 TCP 数据源处理
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming案例分析
- 大数据Spark企业级实战版【学习笔记】----Spark Streaming
- Spark学习笔记(29)Spark Streaming日志和Web监控台
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming的编程模式
- Spark学习笔记(30)集群运行模式下的Spark Streaming调试
- spark学习笔记总结-spark入门资料精化
- Spark Streaming学习笔记
- spark学习笔记总结
- Spark学习笔记-Streaming-1
- Spark学习笔记总结-超级经典总结
- spark-streaming-[8]-Spark Streaming + Kafka Integration Guide0.8.2.1学习笔记
- Spark学习笔记(3)SparkStreaming架构进阶之Job和容错
- spark学习笔记六:Spark Streaming
- Spark学习笔记(18)Spark Streaming中空RDD处理
- Spark2.x学习笔记:18、Spark Streaming程序解读
- Spark学习笔记(4)Spark Streaming的Exactly-One的事务处理
- Spark学习笔记(27)详解Spark Streaming的运行日志