您的位置：首页 > 运维架构

Spark Streaming 监控HDFS目录

2017-12-19 12:12 274 查看

package org.lm.spark.streaming

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

object StreamingWordCountOnLine {
def main(args: Array[String]): Unit = {
val conf=new SparkConf().setAppName("Streaming Word Count OnLine").setMaster("spark://192.168.189.128:7077")
val ssc=new StreamingContext(conf,Seconds(10))
val lines=ssc.textFileStream("hdfs://192.168.189.128:9000/user/StreamingText")
val words=lines.flatMap(_.split(" "))
val pairs=words.map(word=>(word,1))
val wordcounts=pairs.reduceByKey(_+_)
wordcounts.print()
ssc.start()
ssc.awaitTermination()
}

}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

spark streaming监控HDFS文件目录
Spark Streaming监控HDFS输入流
Spark Streaming之：Flume监控目录下文件内容变化，然后Spark Streaming实时监听Flume，然后从其上拉取数据，并计算出结果
大数据IMF传奇行动绝密课程第85课：基于HDFS的SparkStreaming案例实战和内幕源码解密
How-to: make spark streaming collect data from Kafka topics and store data into hdfs
Spark Streaming 实时监控一个HDFS的文件夹，当新的文件进来（名字不能重复），将对新文件进行处理。
spark streaming 应用程序监控邮件提醒
Spark Streaming---HDFSwordcount
Spark Streaming + Elasticsearch构建App异常监控平台
spark解决方案系列--------1.spark-streaming实时Join存储在HDFS大量数据的解决方案
第30课：集群运行模式下的Spark Streaming日志和Web监控台实战演示彻底解密
spark streaming读取HDFS
spark streaming 应用程序监控
Spark来监控hdfs里的文件，并用wordcount计算
Spark Streaming---HDFSwordcount
基于HDFS的SparkStreaming案例实战和内幕源码解析
flume + kafka + sparkStreaming + HDFS 构建实时日志分析系统
基于HDFS的SparkStreaming案例实战和内幕源码解密
Spark Streaming、HDFS结合Spark JDBC External DataSouces处理案例
SparkStreaming实现HDFS的wordCount(java版)

新的分享

新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
民生银行日接入量15T的ELK日志平台（Apollo+ES源码改造） - 运维
邱盛昌：OPPO商业化数据体系建设实战
一篇吃透监控系统：常用组合方案和主流工具选型 - 运维
DevOps落地成不成，关键不在持续集成？ - 运维
mlops的一些记录
用Prometheus监控K8S，目前最实用的部署方式都说全了（有彩蛋） - 运维
asio 使用 openssl 示例
Netty源码研究笔记（4）——EventLoop系列
许北林：我为什么加入OpenHarmony生态？又为什么要做“启航KP”开发套件？
【直播回顾】OpenHarmony知识赋能五期第五课——多媒体子系统之视频解读
【直播回顾】如何成为一名优秀的OpenHamrony贡献者？

章节导航