您的位置:首页 > 编程语言 > Java开发

Java ThreadPoolExecutor 线程池 tips 1:单线程吞吐量来估计系统的线程数目

2013-01-15 21:05 274 查看

问题:我们需要多大的线程池

java中的线程池想必都用过,最简单的是通过Executors工厂方法得到线程池,比如固定池大小,task缓冲为无限大小的队列

[java]
view plaincopy

ExecutorService pool = Executors.newFixedThreadPool(poolSize);
...
pool.execute(new Handler(serverSocket.accept()));

实际应用中使用线程池时,第一个问题是:我们需要多大的线程池?

根据单线程的吞吐量来估计线程池的大小

假如我们有一些批处理任务需要完成,根据每个任务的处理时间和需要处理的任务数目(单位时间)很容易计算出需要的线程数目。

Task1Task2
每秒需要处理的任务数目5 task/s10 task/s
每个任务的处理时间3 s2.4 s
每个任务的处理速度0.3 task/s0.416 task/s
线程数目5 /0.3 = 1510/0.416 = 24
举个例子,在麦当劳点餐时,假如每个顾客的平均点餐是30秒,如果开单个窗口,则每分钟能接受两个顾客的点餐。麦当劳的订单处理是每分钟10位顾客,所以麦当劳经理希望每分钟接受10顾客的点餐。因此这个麦当劳餐厅需要设置5个窗口来保证其供应系统的满负荷。

问题:并发编程中,单CPU最佳线程数是多少?

在考虑最佳线程数时,网络上的建议往往是从任务的类型来决定单CPU的最佳线程。如果任务是CPU密集型或者说是计算密集型的,那么单个线程/CPU让系统满负荷。

反之,如果任务是IO-bound,则需要多个线程来避免CPU因为等待IO而闲置。

个人觉得这里的IO-Bound理解为non-cpu bound更为贴切,可能在实际系统中,IO (disk, network)往往是系统的主要瓶颈,所以人们往往使用IO-bound来和CPU-bound进行比较。

淘宝开发人员蒋江伟(小邪)在<服务器端性能优化>中给过一个计算公式

最佳线程数量=((线程等待时间+线程cpu时间)/线程cpu时间) * cpu数量

这个公式实际上是cpu时间和非cpu时间之间的一个比例。

在slides中小邪提了一个观点是

如果要提升服务器端的响应时间RT,采用减少IO的时间能达到最佳效果,比如合并多个IO请求
如果要提升QPS,采用优化CPU的时间能达到最佳效果。比如响应时间(任务处理时间)是90ms,其中IO为80ms,cpu为10ms,如果将cpu缩减为5ms,则系统的吞吐量可以提高一倍。根据公式 QPS = 1/RT,上述结论当然不正确。其给出的解释是,cpu缩减为5ms后,线程数可以增加一倍,线程的增加导致了系统的吞吐量的大幅提高。

流水线中的吞吐量公式比较, pipeline throughtput = 1 instr / Max (stage time),流水线中的最耗时部分决定了流水线的吞吐量。

而上面的公式是系统的最快的部分(cpu)决定了系统的吞吐量,是不是矛盾?

麦当劳的例子:假如点餐需要30 seconds,处理单子需要6 seconds,30/6=5个窗口

如果将处理单子速度提供一倍,3秒钟响应一个,则可以开30/3=10个窗口,系统的吞吐量加倍。

系统的最快部分(CPU)定义了系统的边界,这个边界形成一个理论上本文开始提到的每秒需要处理的任务数目。

而系统中的等待时间(非CPU)近似为系统的response time/latency(假定非cpu时间占大头),同边界时间之比,即为系统所需要的并发数。

又假定并发数越多,系统的吞吐量越大,所以优化cpu时间能导致QPS的大幅提升。

上述公式的本质如下图:增加系统中耗时部分(IO)的并发数,使系统的吞吐量和系统中最快部分(cpu)的速度一致。如果是多核,相当于最快部分(cpu)增加了并发,相应的耗时部分并发数乘上相应的系数(cpu数量).

实际情况是:我们是增加相应的线程(并发任务数),而并不是增加了系统的IO设备。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: