您的位置:首页 > 运维架构

运维人员处理服务器故障的方法总结

2017-02-04 20:21 489 查看
运维人员处理服务器故障的方法总结一、尽可能搞清楚问题的前因后果
[b]二、查看有谁在线[/b]
[b]who
[/b]
[b]last
[/b]
[b][b]三、查看之前执行了什么命令[/b][/b]
[b][b] history[/b][/b]
[b][b][b]四、查看现在在运行的进程是什么[/b][/b][/b]
pstree -a
ps aux
五、查看监听的网络服务

netstat -nxlp
netstat -ntlp
netstat -nulp
六、查看CPU 和内存

free -m
uptime
top
htop
七、查看硬件
lspci
dmidecode
ethtool
[b]八、查看IO 性能[/b]


iostat -kx 2
vmstat 2 10
mpstat 2 10
dstat --top-io --top-bio #可以看到谁在进行 IO
[b][b]九、查看挂载点 和 文件系统[/b][/b]

mount
cat /etc/fstab
vgs
pvs
lvs
df -h
lsof +D /

[b][/b]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息