您的位置：首页 > 其它

spark累加器介绍-案例通过累加器统计文章中空白行数量

2017-03-06 13:44 197 查看

1.累加器介绍

累加器（Accumulator）是一种只能通过关联操作进行“加”操作的变量，因此具有高效的并行计算能力。

1.首先，通过accumulator(v)方法创建Accumulator并初始化为0

val accum = sc.accumulator(0)

2.然后，通过运算符+= 进行累加操作
x => accum+=x

3.通过value方法读取累加器的值

accum.value

val accum = sc.accumulator(0)

sc.parallelize(Array(1,2,3,4)).foreach(x => accum+=x)

println(accum.value) // 10

复制下载的spark源码中的README.md中的几行，如下图所示：

在累加空行的时候，我们通过split函数将单词切分开，然后输出到指定的目录中，可以查看输出后的结果。

实现代码链接如下：spark中用scala编写累加器小程序统计文章中空白行
http://download.csdn.net/detail/rivercode/9771759

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航