线上问题排查思路
2015-04-20 13:36
453 查看
弄清线上的配置:linux版本,cpu核数,内存大小,jdk版本。以免服务器配置不同导致出现问题。
1。错误是什么时候开始的?现在是否已经恢复?
2。是否是个别用户问题,还是所有用户问题?是单台服务器的问题还是所有服务器的问题?
3。接口的请求量是否异常?
4。接口的响应时间是否异常?如果响应时间异常,是否能定位到具体哪个环节异常,此时需要分步耗时日志?
5。四层,7层负载是否异常?如:nginx请求量是否异常?
6。tomcat线程池是否异常?
7。db是否异常?是否有主从延迟?
8。机器CPU、内存、磁盘IO、网络是否异常?
top 查看进程活动状态以及一些系统状况
vmstat 查看系统状态、硬件和系统信息等
iostat 查看CPU 负载,硬盘状况
sar 综合工具,查看系统状况
mpstat 查看多处理器状况
netstat 查看网络状况
iptraf 实时网络状况监测
tcpdump 抓取网络数据包,详细分析
tcptrace 数据包分析工具
netperf 网络带宽工具
dstat 综合工具,综合了 vmstat, iostat, ifstat, netstat 等多个信息
lsof
netstat -anpl|fgrep
netstat -ntulp|grep java
du -h --max-depth=1
9。jvm进程,内存,gc是否异常?
常用的命令有:jstack、jmap、jstat
10。消息队列是否拥堵?
11。缓存,redis是否异常?包括缓存命中率等。
1。错误是什么时候开始的?现在是否已经恢复?
2。是否是个别用户问题,还是所有用户问题?是单台服务器的问题还是所有服务器的问题?
3。接口的请求量是否异常?
4。接口的响应时间是否异常?如果响应时间异常,是否能定位到具体哪个环节异常,此时需要分步耗时日志?
5。四层,7层负载是否异常?如:nginx请求量是否异常?
6。tomcat线程池是否异常?
7。db是否异常?是否有主从延迟?
8。机器CPU、内存、磁盘IO、网络是否异常?
top 查看进程活动状态以及一些系统状况
vmstat 查看系统状态、硬件和系统信息等
iostat 查看CPU 负载,硬盘状况
sar 综合工具,查看系统状况
mpstat 查看多处理器状况
netstat 查看网络状况
iptraf 实时网络状况监测
tcpdump 抓取网络数据包,详细分析
tcptrace 数据包分析工具
netperf 网络带宽工具
dstat 综合工具,综合了 vmstat, iostat, ifstat, netstat 等多个信息
lsof
netstat -anpl|fgrep
netstat -ntulp|grep java
du -h --max-depth=1
9。jvm进程,内存,gc是否异常?
常用的命令有:jstack、jmap、jstat
10。消息队列是否拥堵?
11。缓存,redis是否异常?包括缓存命中率等。
相关文章推荐
- Java 线上问题排查思路与工具使用
- 线上PHP问题排查思路与实践
- 线上PHP问题排查思路与实践
- 线上问题排查-思路小分享
- Java 线上问题排查思路与工具使用
- 线上PHP问题排查思路与实践
- Java 线上问题排查思路与工具使用
- 线上问题排查(1)——java服务器load飚高排查思路
- 线上问题的解决思路
- 排查线上问题
- IIS 503问题排查思路
- Oracle数据库连接问题排查思路
- 记一次线上问题的排查过程
- 读书笔记:线上性能问题初步排查方法
- Java应用线上问题排查的常用工具和方法
- 如何排查解决线上问题-java版
- 【Java web应用线上问题排查】spring异常BeanCreationNotAllowedException
- Linux 系统 CPU 占用率较高问题排查思路
- 线上问题排查方法
- 线上问题排查命令