您的位置:首页 > 其它

Elastic-Job何为分布式作业

2016-10-23 09:17 204 查看
原文地址:http://dangdangdotcom.github.io/elastic-job/post/1.x/distribution/


何为分布式作业?


分片概念

任务的分布式执行,需要将一个任务拆分为n个独立的任务项,然后由分布式的服务器分别执行某一个或几个分片项。
例如:有一个遍历数据库某张表的作业,现有
2
台服务器。为了快速的执行作业,那么每台服务器应执行作业的
50%

为满足此需求,可将作业分成
2
片,每台服务器执行
1
片。作业遍历数据的逻辑应为:服务器
A
遍历
ID
以奇数结尾的数据;服务器
B
遍历
ID
以偶数结尾的数据。
如果分成
10
片,则作业遍历数据的逻辑应为:每片分到的分片项应为
ID%10
,而服务器A被分配到分片项
0,1,2,3,4
;服务器B被分配到分片项
5,6,7,8,9
,直接的结果就是服务器
A
遍历
ID
0-4
结尾的数据;服务器
B
遍历
ID
5-9
结尾的数据。


分片项与业务处理解耦

Elastic-job
并不直接提供数据处理的功能,框架只会将分片项分配至各个运行中的作业服务器,开发者需要自行处理分片项与真实数据的对应关系。


分布式作业的执行

Elastic-job
并无作业调度中心节点,而是基于部署作业框架的程序在到达相应时间点时各自触发调度。
注册中心仅用于作业注册和监控信息存储。而主作业节点仅用于处理分片和清理等功能。


个性化参数的适用场景

个性化参数即
shardingItemParameters
,可以和分片项匹配对应关系,用于将分片项的数字转换为更加可读的业务代码。
例如:按照地区水平拆分数据库,数据库
A
是北京的数据;数据库
B
是上海的数据;数据库
C
是广州的数据。
如果仅按照分片项配置,开发者需要了解
0
表示北京;
1
表示上海;
2
表示广州。
合理使用个性化参数可以让代码更可读,如果配置为
0=北京
,
1=上海
,
2=广州
,那么代码中直接使用北京,上海,广州的枚举值即可完成分片项和业务逻辑的对应关系。


作业高可用

Elastic-job
提供最安全的方式执行作业。将分片项设置为
1
,并使用多于
1
台的服务器执行作业,作业将会以
1
n
从的方式执行。
一旦执行作业的服务器崩溃,等待执行的服务器将会在下次作业启动时替补执行。 开启失效转移功能效果更好,可以保证在本次作业执行时崩溃,备机立即启动替补执行。


最大限度利用资源

Elastic-job
也提供最灵活的方式,最大限度的提高执行作业的吞吐量。将分片项设置为大于服务器的数量,最好是大于服务器倍数的数量,作业将会合理的利用分布式资源,动态的分配分片项。
例如:
3
台服务器,分成
10
片,则分片项分配结果为服务器
A=0,1,2
;服务器
B=3,4,5
;服务器
C=6,7,8,9

如果服务器
C
崩溃,则分片项分配结果为服务器
A=0,1,2,3,4
;服务器
B=5,6,7,8,9
。在不丢失分片项的情况下,最大限度的利用现有资源提高吞吐量。

==============================================================================================================
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: