您的位置：首页 > 其它

Akka实战：分散、聚合模式

2015-11-26 00:16 417 查看

分散与聚合：简单说就是一个任务需要拆分成多个小任务，每个小任务执行完后再把结果聚合在一起返回。

代码 http://git.oschina.net/yangbajing/akka-action

实例背景

本实例来自一个真实的线上产品，现将其需求简化如下：

传入一个关键词：

key

，根据

key

从网上抓取相关新闻

可选传入一个超时参数：

duration

，设置任务到期时必须反回数据（返回实际已抓取数据）

若超时到返回实际已爬取数据，则任务应继续运行直到所以数据抓取完成，并存库

设计

根据需求，一个简化的分散、聚合模式可以使用两个

actor

来实现。

NewsTask：接收请求，并设置超时时间

SearchPageTask：执行实际的新闻抓取操作（本实例将使用TimeUnit模拟抓取耗时）

实现

NewsTask

https://github.com/yangbajing/akka-action/blob/master/src/main/scala/me/yangbajing/akkaaction/scattergather/NewsTask.scala

override def metricPreStart(): Unit = {
context.system.scheduler.scheduleOnce(doneDuration, self, TaskDelay)
}

override def metricReceive: Receive = {
case StartFetchNews =>
_receipt = sender()
(0 until NewsTask.TASK_SIZE).foreach { i =>
context.actorOf(SearchPageTask.props(self), "scatter-" + i) ! SearchPage(key)
}

case GetNewsItem(newsItem) =>
_newses ::= newsItem
if (_newses.size == NewsTask.TASK_SIZE) {
logger.debug(s"分散任务，${NewsTask.TASK_SIZE}个已全部完成")

if (_receipt != null) {
_receipt ! NewsResult(key, _newses)
_receipt = null
}
self ! PoisonPill
}

case TaskDelay =>
if (_receipt != null) {
_receipt ! NewsResult(key, _newses)
_receipt = null
}
}

metricPreStart

方法中设置定时方法，调用时间为从代码运行开始到

doneDuration

时间为止。定时被触发时将向当前

Actor

发送一个

TaskDelay

消息。

在

metricReceive

方法中，分别对

StartFetchNews

、

GetNewsItem

、

TaskDelay

三个消息进行操作。

在收到

StartFetchNews

消息时，actor首先保存发送者actor的引用（结果将返回到此actor）。再根据

TASK_SIZE

生成相应子任务

GetNewsItem

消息的处理中，每收到一个消息就将其添加到

_newses

列表中。并判断当

_newses

个数等于

TASK_SIZE

时（所有子任务已完成）将结果发送给

_receipt

。

self ! PoisonPill

，这句代码停止actor自身。它将把“毒药”发送到

NewsTask

Actor的接收邮箱队列中。

TaskDelay

消息被触发时，将直接返回已完成的新闻

_newses

。返回数据后并不终止当前还未运行完任务。

SearchPageTask

https://github.com/yangbajing/akka-action/blob/master/src/main/scala/me/yangbajing/akkaaction/scattergather/SearchPageTask.scala

override def metricReceive: Receive = {
case SearchPage(key) =>
// XXX 模拟抓取新闻时间
TimeUtils.sleep(Random.nextInt(20).seconds)

val item = NewsItem(
"http://newssite/news/" + self.path.name,
"测试新闻" + self.path.name,
self.path.name,
TimeUtils.now().toString,
"内容简介", "新闻正文")

taskRef ! GetNewsItem(item)
context.stop(self)
}

SearchPageTask

的代码逻辑就比较易懂了，这里使用

sleep

来模拟实际抓取新闻时的耗时。生成结果后返回数据给｀taskRef`，并终止自己。

执行测试

./sbt
akka-action > testOnly me.yangbajing.akkaaction.scattergather.ScatterGatherTest

总结

这是一个简单的

Akka

实例，实现了任务分发与结果聚合。提供了一种在指定时间内返回部份有效数据，同时任务继续执行的方式。这种分散、聚合的模式在实际生产中很常用，比如对多种数据源的整合，或某些需要长时间运行同时对返回数据完整性无强制要求的情况等。

MetricActor

演示了怎么自定义

Actor

，并为其提供一些侦测点的方式。以后有时间会写篇详文介绍。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： scala akka actor

相关文章推荐

新的分享

章节导航