大数据Spark “蘑菇云”行动第76课: Kafka+Spark Streaming+Redis项目实战
2016-11-10 21:10
811 查看
大数据Spark “蘑菇云”行动第76课: Kafka+Spark Streaming+Redis项目实战
jedis插件 redis
<dependency>
<groupId>redis.clients</groupId>
<artifactId>jedis</artifactId>
<version>${jedis.version}</version>
</dependency>
SparkSession是面向DataSet编程的,统一了SQLContext、HiveContext和StreamingContext
SparkContext是面向RDD编程;
DirectStream的操作Kafka direct方式,driver去读数据,不需要将数据读取到driver,再把数据发送executor上计算。
DirectStream的操作Kafka的时候Driver获得的只是Kafka数据的元数据,在实际操作的时候把元数据发给分布式的Executors,Executors根据Driver发过来的Kafka的元数据去Kafka上抓取属于自己要处理的数据部分;
几乎所有的情况下一定要使用DirectStream的方式操作Kafka
JSON简单通用跨平台数据通信方式
基于事件Event并且同时能够在线处理和批处理的架构方式称之为:Lamda架构
jedis插件 redis
<dependency>
<groupId>redis.clients</groupId>
<artifactId>jedis</artifactId>
<version>${jedis.version}</version>
</dependency>
SparkSession是面向DataSet编程的,统一了SQLContext、HiveContext和StreamingContext
SparkContext是面向RDD编程;
DirectStream的操作Kafka direct方式,driver去读数据,不需要将数据读取到driver,再把数据发送executor上计算。
DirectStream的操作Kafka的时候Driver获得的只是Kafka数据的元数据,在实际操作的时候把元数据发给分布式的Executors,Executors根据Driver发过来的Kafka的元数据去Kafka上抓取属于自己要处理的数据部分;
几乎所有的情况下一定要使用DirectStream的方式操作Kafka
JSON简单通用跨平台数据通信方式
基于事件Event并且同时能够在线处理和批处理的架构方式称之为:Lamda架构
相关文章推荐
- 大数据Spark “蘑菇云”行动第72课: 基于Spark 2.0.1项目实现之二. 实战 各种小bug修复及性能调优 200并行度调整为2个task
- 大数据Spark “蘑菇云”行动第71课: 基于Spark 2.0.1项目开发分析与实战
- 大数据spark“蘑菇云”行动超大型项目实战第68课:spark RDD案例和spark sql案例对比实战 看电影的例子分析 某门热门电影的年龄、性别分析
- 大数据Spark“蘑菇云”行动第53课: Spark大型项目广告点击项目技术骨架实现之Spark+Kafka+Flume实战 项目!!!大项目!!!超大型大数据项目!!!
- 大数据Spark “蘑菇云”行动第92课:HIVE中的array、map、struct及自定义数据类型案例实战
- 大数据Spark “蘑菇云”行动第79课:Spark GraphX 代码实战及源码剖析
- 大数据Spark“蘑菇云”行动-第11课:Scala面向接口彻底实战和Spark源码鉴赏
- 大数据Spark “蘑菇云”行动前传第3课:在IDE下开发第一个Scala程序透彻解析及Scala控制结构详解实战
- 大数据Spark “蘑菇云”行动前传第5课:零基础实战Scala函数式编程及Spark源码解析
- 大数据Spark “蘑菇云”行动前传18课:Scala偏函数、异常、Lazy值编码实战及Spark源码鉴赏
- 大数据Spark “蘑菇云”行动第88课:Hive脚本、常用命令、having查询及变种实战
- 大数据Spark “蘑菇云”行动前传第2课:Scala零基础实战入门的第一堂课及如何成为Scala高手
- 大数据Spark “蘑菇云”行动第89课:Hive中GroupBy优化、Join的多种类型实战及性能优化、OrderBy和SortBy、UnionAll等实战和优化
- 大数据Spark “蘑菇云”行动补充内容第70课: Spark SQL代码实战和性能调优 4个spark sql调优技巧有用!!!!
- 大数据Spark “蘑菇云”行动Hadoop实战速成之路第29课:Hadoop架构详解及Hadoop集群搭建、配置和测试实战
- 大数据Spark “蘑菇云”行动第52课: Spark大型项目广告点击项目数据建模 项目!!!大项目!!!超大型大数据项目!!!
- 大数据Spark “蘑菇云”行动第91课:Hive中Index和Bucket案例实战及存储类型rcfile实战详解
- 大数据Spark “蘑菇云”行动第84课:Hive配置和实战第一课
- 大数据Spark “蘑菇云”行动前传第9课:Scala类和对象彻底实战和Spark源码鉴赏
- 大数据Spark “蘑菇云”行动前传第22课:Scala集合和高级函数操作实战及Spark源码鉴赏.