您的位置:首页 > 其它

DStream----Spark Streaming操作

2018-03-19 12:16 274 查看
DStream 是随时间推移而收到的数据的序列。每个时间区间收到的数据都作为 RDD 存在,而 DStream 是由这些 RDD 所组成的序列(因此得名“离散化”)。 DStream 可以从各种输入源创建,比如 Flume、 Kafka 或者 HDFS。创建出来的 DStream 支持两种操作,一种是转化操作( transformation),会生成一个新的DStream,另一种是输出操作( output operation),可以把数据写入外部系统中。 DStream提供了许多与 RDD 所支持的操作相类似的操作支持,还增加了与时间相关的新操作,比如滑动窗口。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  DStream SparkStreaming