云计算之路-阿里云上:4000IOPS的RDS+16核CPU的负载均衡
2013-04-15 08:46
309 查看
继续向大家汇报,上周在阿里云的帮助下我们重点解决的是以下两个问题:
1. 在专门跑博客站点的负载均衡中,如果单台云服务器处理的并发请求高(比如超过200 Get Requests/s),CPU有时会出现坐“过山车”的情况,CPU占用瞬间跳到100%,然后又回落(见下图)。这种情况只有1秒的采样才能监控到。当您正好在CPU 100%的时候访问网站,就会遇到502错误。
2. 4月7日下午出现的数据库写入超时问题,详见云计算之路-阿里云上:2013年4月7日14:15~18:35服务器故障经过。
对于第1个问题,我们的解决方案是给博客站点的负载均衡增加了2台云服务器,由原来的2台4核增加为4台4核,共16核。根据观察到目前的情况看,CPU坐“过山车”的情况大大减少。
对于第2个问题,我们的解决方案是将数据库服务器从云服务器迁移至阿里云RDS(关系型数据库服务)上。4月13日凌晨0:20左右完成迁移,我们用的是5型RDS(8G内存,400G存储空间, 800个最大连接数),能承受4000IOPS。从周末观察的情况看,RDS表现很不错,但RDS是否真的表现出色,还需要经过今天访问高峰的考验。
自从3月9日搬上阿里云,到现在已经一个多月了。开始的云计算之路上迎接我们的不是风平浪静,而是风吹雨打。在这段艰难的日子里,大家的理解与支持带给我们力量。相信在我们与阿里云的共同努力下,一定会解决所有问题,在风雨之后见彩虹。
1. 在专门跑博客站点的负载均衡中,如果单台云服务器处理的并发请求高(比如超过200 Get Requests/s),CPU有时会出现坐“过山车”的情况,CPU占用瞬间跳到100%,然后又回落(见下图)。这种情况只有1秒的采样才能监控到。当您正好在CPU 100%的时候访问网站,就会遇到502错误。
2. 4月7日下午出现的数据库写入超时问题,详见云计算之路-阿里云上:2013年4月7日14:15~18:35服务器故障经过。
对于第1个问题,我们的解决方案是给博客站点的负载均衡增加了2台云服务器,由原来的2台4核增加为4台4核,共16核。根据观察到目前的情况看,CPU坐“过山车”的情况大大减少。
对于第2个问题,我们的解决方案是将数据库服务器从云服务器迁移至阿里云RDS(关系型数据库服务)上。4月13日凌晨0:20左右完成迁移,我们用的是5型RDS(8G内存,400G存储空间, 800个最大连接数),能承受4000IOPS。从周末观察的情况看,RDS表现很不错,但RDS是否真的表现出色,还需要经过今天访问高峰的考验。
自从3月9日搬上阿里云,到现在已经一个多月了。开始的云计算之路上迎接我们的不是风平浪静,而是风吹雨打。在这段艰难的日子里,大家的理解与支持带给我们力量。相信在我们与阿里云的共同努力下,一定会解决所有问题,在风雨之后见彩虹。
相关文章推荐
- 云计算之路-阿里云上: RDS实例CPU跑满引发的故障
- 云计算之路-阿里云上:启用Windows虚拟内存引发的CPU 100%故障
- 云计算之路-阿里云上:14:20-14:55博客后台2台服务器都CPU 100%引发的故障
- 云计算之路-阿里云上:节点 CPU 波动引发 docker swarm 集群故障
- 云计算之路-阿里云上:为什么看不见CPU在坐过山车,磁盘IO在蹦极
- 云计算之路-阿里云上:消灭“黑色n秒”第一招——不让CPU空闲
- 云计算之路-阿里云上:对“黑色n秒”问题的最终猜想——CPU C-states引起的
- 云计算之路-阿里云上-新车限行:新购服务器无法访问任何远程25端口
- 云计算之路-阿里云上-新车限行:新购服务器无法访问任何远程25端口
- 云计算之路-迁入阿里云后:20130314云服务器故障经过
- 云计算之路-阿里云上:实战Advanced Logging for IIS分析http内容压缩问题
- 云计算之路-阿里云上:从ASP.NET线程角度对“黑色30秒”问题的全新分析
- 云计算之路-阿里云上-寒流来袭:2014年12月23日21:45-23:15网站故障
- 阿里云大数据计算平台的自动化、精细化运维之路
- 云计算之路:用阿里云 vs Azure的对比测试揭开乌云的面纱
- 云计算之路-阿里云上:攻击的受害者,阿里云的罪人
- 云计算之路-阿里云上:受够了OCS,改用ECS+Couchbase跑缓存
- 云计算之路-阿里云上-幸福没那么容易:“黑色1秒”又出现了
- 云计算之路-Azure vs 阿里云:从负载均衡中摘/挂虚拟机
- 云计算之路-阿里云上:愚人节被阿里云OCS愚