您的位置:首页 > 运维架构 > 网站架构

爬虫架构|利用Kafka处理数据推送问题(3)架构图

2018-08-31 16:50 3487 查看
一、需求
1、对于所有任务产生的实时数据,通过Kafka及时推送。
2、对于新加任务需要去历史全量数据表中获取该任务已有的历史数据。
3、爬虫集群在生产数据时需要去全量数据中进行下匹配,如果不存在才会推送给Kafka。

二、架构设计图


Kafka+MySQL架构设计
三、结语
欢迎相关人员一起交流。

作者:小怪聊职场
链接:https://www.jianshu.com/p/be7ef1e723cc
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java spring 程序员