您的位置：首页 > 运维架构 > Apache

【云星数据---Apache Flink实战系列(精品版)】：Apache Flink高级特性与高级应用016-Flink中广播变量和分布式缓存002

2017-11-19 16:19 981 查看

2.flink中的分布式缓存

flink支持将文件，分布式缓存到worker节点，以便程序计算使用。

执行程序

package code.book.batch.sinksource.scala

import org.apache.flink.api.common.functions.RichMapFunction
import org.apache.flink.api.scala.{DataSet, ExecutionEnvironment, _}
import org.apache.flink.configuration.Configuration

import scala.collection.mutable.ListBuffer
import scala.io.Source

/**
* hdfs:///input/flink/workcount.txt文件内容如下：
* zhagnsan:4
* lisi:5
*/
object DistributedCache001 {
def main(args: Array[String]): Unit = {
val env = ExecutionEnvironment.getExecutionEnvironment
//1.准备缓存数据，
val path = "hdfs:///input/flink/workcount.txt"
env.registerCachedFile(path, "MyTestFile")

//2.准备工人数据
case class Worker(name: String, salaryPerMonth: Double)
val workers: DataSet[Worker] = env.fromElements(
Worker("zhagnsan", 1356.67),
Worker("lisi", 1476.67)
)

//3.使用缓存数据和工人数据做计算
workers.map(new MyMapper()).print()
class MyMapper() extends RichMapFunction[Worker, Worker] {
private var lines: ListBuffer[String] = new ListBuffer[String]
//3.1在open方法中获取缓存文件
override def open(parameters: Configuration): Unit = {
super.open(parameters)
//access cached file via RuntimeContext and DistributedCache
val myFile = getRuntimeContext.getDistributedCache.getFile("MyTestFile")
val lines = Source.fromFile(myFile.getAbsolutePath).getLines()
lines.foreach(f = line => {
this.lines.append(line)
})
}

//3.2在map方法中使用获取到的缓存文件内容
override def map(worker: Worker): Worker = {
var name = ""
var month = 0
//分解文件中的内容
for (s <- this.lines) {
val tokens = s.split(":")
if (tokens.length == 2) {
name = tokens(0).trim
if (name.equalsIgnoreCase(worker.name)) {
month = tokens(1).trim.toInt
}
}
//找到满足条件的信息
if (name.nonEmpty && month > 0.0) {
return Worker(worker.name, worker.salaryPerMonth * month)
}
}
//没有满足条件的信息
Worker(worker.name, worker.salaryPerMonth * month)
}
}
}
}

执行效果

Worker(zhagnsan,5426.68)
Worker(lisi,7383.35)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航