【故障公告】阿里云 RDS 数据库突发 CPU 近 100% 引发全站故障
2020-08-20 21:55
1411 查看
今天晚上9点我们收到阿里云的告警通知:
【阿里云监控】华东1(杭州)-云数据库RDS版<cnblogsdb> [instanceId=xxx] 于21:00 发生告警, 前往诊断 CPU使用率平均值(98.25>=80 ), 持续时间4分钟, rds_CpuUsage
收到通知后,我们立即登录阿里云 RDS 控制台进行主备库切换,等主备库完成切换后一看并没有切换过来,赶紧再次进行切换,第2次切换成功了,切换完成后 CPU 立刻降至正常水平,全站恢复正常。
这次故障发生时间是8月20日20:55~21:14,由此给您带来麻烦,请您谅解。
上次发生同样故障是6月24日,详见 【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问。
阿里云数据库专家分析后怀疑是“LINQ 生成的 SQL 存在问题,导致概率性 SQL Server 出现参数嗅探问题”。
我们会进一步分析并优化这次引发参数嗅探问题的 SQL 语句。
相关文章推荐
- 云上的芯脏病:奇怪的阿里云 RDS 数据库突发 CPU 近 100% 问题
- 阿里云数据库维护记录-RDS MySQL IOPS 使用率高的原因和处理--RDS实例CPU超过100%的分析
- 云计算之路-阿里云上:14:20-14:55博客后台2台服务器都CPU 100%引发的故障
- 【故障公告】数据库服务器 CPU 近 100% 引发的故障(源于 .NET Core 3.0 的一个 bug)
- 云计算之路-阿里云上:启用Windows虚拟内存引发的CPU 100%故障
- 阿里云 RDS 数据库又发 CPU 近 100% 的“芯脏病”
- 云计算之路-阿里云上:RDS数据库连接数过万引发故障,主备库切换后恢复正常
- 云计算之路-阿里云上: RDS实例CPU跑满引发的故障
- [故障公告] 13-52-14-03,访问量突增,博客web服务器CPU 100%
- 云计算之路-阿里云上:节点 CPU 波动引发 docker swarm 集群故障
- [公告]计划于4月12日23:30~23:59将数据库迁移至阿里云RDS
- [故障公告] 13:52-14:03,访问量突增,博客web服务器CPU 100%
- 抱歉!15:44-16:39阿里云RDS故障造成全站不能正常访问
- [故障公告] 13-52-14-03,访问量突增,博客web服务器CPU 100%
- [故障公告]14:40-15:00博客站点web服务器雪崩似的CPU 100%
- 阿里云RDS优化MySQL,解决数据库CPU占用高
- 阿里云云数据库RDS秒级监控功能解锁,通宵加班找故障将成为过去式
- 云计算之路-阿里云上:13:43-13:44之间RDS故障影响了全站的正常访问
- 【故障公告】阿里云抢占式实例服务器被自动释放引发的故障
- 阿里云RDS实例CPU超过100%