您的位置:首页 > 其它

吐槽:关于实时与离线计算的事儿

2013-03-12 23:41 22 查看
貌似这算是开博的第一篇文章,居然就从吐槽开篇鸟。虽然先前有写过几篇,但也都删掉了,感觉写得不好,没意思。
好吧,正题,今天又是一大班码农在纠结某个看上去很没道理的功能,总感觉很没必要,其实道理也很明显,就像你永远不能超越CAP,不能让硬盘跟内存的速度一样快的道理一样。其实,要改变也不是完全没有办法,但要在功能上做一些折中选择。

下面描述下这个业务场景吧,服务于卖家,要去实时计算卖家的所有商品,即使他有10w个商品也要算(这个做实时计算怎么可能,虽然是极少可能出现,但作为码农的思想,极端情况是要考虑的,在淘宝上还真有可能存在这么多商品的卖家),计算肯定就是需要时间,即使1ms一个,10w个就100秒了,卖家打开一个页面要100s,他要疯掉了。文字描述貌似有点无力,还是把流程图及模块图画画吧。





现在大概有两个方案:
一个是实时的计算,来一个卖家就实时算一次,这样的话,商品数多的时候会好慢,做分页功能得把商品总数算出来—也就是要把全部商品算一次;
另一个是离线计算好,但是这样会产生延迟,而且有些卖家不来,你也得算好摆在那里,好浪费,因为很多卖家都是不来的。延迟上,一般是一天,但是会随着延迟的时间越短,计算的次数会越多,浪费就越多。

现实中,PD的要求就是要实时,要翻页,一点都不退让。

好吧,在这里只吐槽下这个不可实现的功能,如果大家有好的方案也可以拍砖哦。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: