云计算之路-阿里云上:负载均衡的小感冒,我们早就感觉到
2017-03-15 22:50
134 查看
最近一段时间遇到一个奇怪问题,在上班时间在办公室用Safari浏览器访问我们网站首页,有时如果有一段时间不访问,再次访问时第1次打开网站首页速度会比较慢(卡顿一会),之后就恢复平时飞快的速度。几乎每个工作日都会遇到。
看似这个问题影响不大,但每次遇到都让人很难受,一次一次的秒开突然来一次卡顿就如同在高速上遇到红灯。
对于这个问题我们一直没有专门去排查,以为可能是办公室网络的问题。昨天实在有些忍受不了,准备第2天排查一下这个问题。
后来昨天下午17:43左右,阿里云华东1地域可用区E部分SLB(负载均衡)突然出现异常,我们有2个负载均衡受到了影响。19:11左右故障修复,我们收到了阿里云的短信通知。接着,在晚上22:30左右,我们又收到了阿里云的短信通知:
SLB发现一稳定性隐患,虽不影响使用但存在风险,需紧急修复。我方将于3月15日1~6时进行各地域的修复。。。
我们遇到的奇怪问题,阿里云负载均衡的故障与隐患,这两个看似毫无关系的事情,却在3月15日发生了关联 —— 当阿里云修复了负载均衡的稳定性隐患后,我们遇到的奇怪问题在今天18:00之前神奇地消失了,以前要出现都是在18:00之前出现,下午出现更频繁一些。
正当我们满以为阿里云已经彻底修复负载均衡的稳定性隐患,可以与卡顿问题说88的时候,18:00之后问题竟然又出现了,只是卡顿的时间比之前稍短一些,难道只是巧合,卡顿问题与阿里云负载均衡的稳定性隐患无关?
这时我们突然想起2月9日那次的阿里云负载均衡故障——[故障公告]阿里云“华东1地域部分负载均衡https访问异常“引起部分站点无法访问,在那次故障之前,我们也遇到过同样的卡顿问题,在那次故障修复之后的一段时间,卡顿问题也随之神奇地消失了,然后就把那段时间遭遇的卡顿问题给忘了。
另外,最近我们有一位同事在宿舍里上网时访问我们网站时也遇到了奇怪问题,能访问网站首页,但个人博客打不开,一直以为是所用的华数网络的问题。当阿里云修复了负载均衡的稳定性隐患后,这个奇怪问题也神奇地消失了。
当我们正在犹豫我们遇到的卡顿问题是不是与阿里云负载均衡的稳定性隐患有关时。。。
20:21左右,我们再次收到了阿里云的短信通知:
负载均衡产品发现一稳定性隐患,虽不影响使用但存在风险,需进一步修复。。。
原来是负载均衡的感冒还没痊愈,稳定性隐患还没彻底修复,今天18:00之后遇到的卡顿情况属正常的感冒症状。
习惯了秒开,真的无法适应那一点点的卡顿,希望阿里云能尽快彻底修复负载均衡的稳定性隐患。
看似这个问题影响不大,但每次遇到都让人很难受,一次一次的秒开突然来一次卡顿就如同在高速上遇到红灯。
对于这个问题我们一直没有专门去排查,以为可能是办公室网络的问题。昨天实在有些忍受不了,准备第2天排查一下这个问题。
后来昨天下午17:43左右,阿里云华东1地域可用区E部分SLB(负载均衡)突然出现异常,我们有2个负载均衡受到了影响。19:11左右故障修复,我们收到了阿里云的短信通知。接着,在晚上22:30左右,我们又收到了阿里云的短信通知:
SLB发现一稳定性隐患,虽不影响使用但存在风险,需紧急修复。我方将于3月15日1~6时进行各地域的修复。。。
我们遇到的奇怪问题,阿里云负载均衡的故障与隐患,这两个看似毫无关系的事情,却在3月15日发生了关联 —— 当阿里云修复了负载均衡的稳定性隐患后,我们遇到的奇怪问题在今天18:00之前神奇地消失了,以前要出现都是在18:00之前出现,下午出现更频繁一些。
正当我们满以为阿里云已经彻底修复负载均衡的稳定性隐患,可以与卡顿问题说88的时候,18:00之后问题竟然又出现了,只是卡顿的时间比之前稍短一些,难道只是巧合,卡顿问题与阿里云负载均衡的稳定性隐患无关?
这时我们突然想起2月9日那次的阿里云负载均衡故障——[故障公告]阿里云“华东1地域部分负载均衡https访问异常“引起部分站点无法访问,在那次故障之前,我们也遇到过同样的卡顿问题,在那次故障修复之后的一段时间,卡顿问题也随之神奇地消失了,然后就把那段时间遭遇的卡顿问题给忘了。
另外,最近我们有一位同事在宿舍里上网时访问我们网站时也遇到了奇怪问题,能访问网站首页,但个人博客打不开,一直以为是所用的华数网络的问题。当阿里云修复了负载均衡的稳定性隐患后,这个奇怪问题也神奇地消失了。
当我们正在犹豫我们遇到的卡顿问题是不是与阿里云负载均衡的稳定性隐患有关时。。。
20:21左右,我们再次收到了阿里云的短信通知:
负载均衡产品发现一稳定性隐患,虽不影响使用但存在风险,需进一步修复。。。
原来是负载均衡的感冒还没痊愈,稳定性隐患还没彻底修复,今天18:00之后遇到的卡顿情况属正常的感冒症状。
习惯了秒开,真的无法适应那一点点的卡顿,希望阿里云能尽快彻底修复负载均衡的稳定性隐患。
相关文章推荐
- 云计算之路-Azure vs 阿里云:从负载均衡中摘/挂虚拟机
- 云计算之路-阿里云上-幸福没那么容易:“黑色1秒”又出现了
- 云计算之路-阿里云上:启用Windows虚拟内存引发的CPU 100%故障
- 阿里云视频服务负载均衡架构
- 云计算之路-阿里云上-新车限行:新购服务器无法访问任何远程25端口
- 集群、分布式计算、负载均衡的区别
- 云计算之路-阿里云上:愚人节被阿里云OCS愚
- 云计算之路-阿里云上: RDS实例CPU跑满引发的故障
- 云计算之路-阿里云上:从ASP.NET线程角度对“黑色30秒”问题的全新分析
- 云计算之路-阿里云上:禁用Windows虚拟内存引发的重启
- 云计算之路-阿里云上:基于Xen的IO模型进一步分析“黑色0.1秒”问题
- 云计算之路-阿里云上:消灭“黑色n秒”第一招——不让CPU空闲
- 云计算之路:用阿里云 vs Azure的对比测试揭开乌云的面纱
- 阿里云大数据计算平台的自动化、精细化运维之路
- 云计算之路-阿里云上:Linux内核bug引起的“黑色10秒钟”
- 云计算之路-迁入阿里云后:20130314云服务器故障经过
- 云计算之路-阿里云上:因为网络问题,物理机换回虚拟机
- 云计算之路-阿里云上:9:55-10:08因流量攻击被进黑洞,造成主站不能正常访问
- 阿里云SLB双机IIS多站点负载均衡部署笔记
- 云计算之路-阿里云上-2017年最错误的选择: 生产环境使用 docker swarm