您的位置:首页 > 其它

巡检基本步骤

2013-11-26 23:01 183 查看
1、 机房环境检查

零地电压是否小于1V

温度(摄氏 ℃)

10 ℃-40℃

湿度(%)

8% -80%

电源线的母头是否为左零右火电压值是否为240V

查看硬件情况

检查设备故障灯,一般为橙色并有故障标志。

有没有异常声响,如硬盘、风扇等。

有没有破损的电缆等

2、 主机检查

1)系统空间使用情况,文件系统是否有“满”。命令:df –k

2)查看卷组信息,有没有"stale"状态的逻辑卷 命令:lsvg -l rootvg

3)检查内存交换区(paging space)使用率是否超过70% 命令:# lsps –s

#lsps –a

观察内存大小的命令:lsattr –El mem0

命令:vmstat 2 5

显示从系统启动到现在使用fork(创建的进程)的数量 命令:vmstat - f

4)当前操作系统版本 命令 :oslevel

5)系统性能检查:

a) CPU性能: 使用Vmstat, topas来检查

b) 内存使用情况:也是使用topas, vmstat来检查

c) 检查IO平衡使用情况:使用iostat来检查

d) 交换空间使用情况: 使用lsps –a来检查

6)网络检查

netstat -i 查看网卡状态

Ierrs/Ipkts 和 Oerrs/Opkts是否>1%

ping host_name /IP Address 查看是否通和是否有丢包。

路由表 #netstat -rn 查看路由表是否正确,ping 各路由器是否通

核对主机名: #hostname

#ifconfig -a

#lsattr –El inet0

7)检查dump设置

#sysdumpdev –l

8)检查系统合法/非法登陆情况

使用Last命令来检查来自登陆的地方。

9) 检查系统是否有巨大的Core文件生成

使用 find / -name core –print来检查。对Core文件,一般直接删除就可以了。

10)网卡的状态、IP地址、路由表等 命令:netstat –in

查看 /etc/hosts

11)列出系统中已安装的网络适配器 命令:#lsdev -Cc adapter

列出系统中已配置的网络接口 命令:#lsdev -Cc if

12) snap -a来搜索AIX系统的大部分配置信息

13) 查看错误报告 命令: errpt,ssa_ela ,errpt |more

errpt -a >/tmp/errpt_20071111.txt //将错误导出 errpt -a > errptlog.txt

errpt 查看aix的错误日志

errpt -dH //硬件故障

errpt -dS //软件故障

errpt –a | pg //获得所有错误日志的详细报告

14)有否发给root用户的错误报告(mail)

15)查看系统信息 命令:lsconf |more

lsdev -Cc processor

lsattr -El procX

prtconf |more

bindprocessor -q

16)检查hacmp.out,smit.log,boot.log 命令:

lssrc -g cluster 看一下 hacmp.out 命令:tail -f /tmp/hacmp.out

在tmp里面查看有无smit.log,用vi查看

boot.log 查看:# alog -o -t boot

17)查看卷组信息,有没有"stale"状态的逻辑卷 命令:lsvg -l rootvg

18)使用iostat命令监控I/O 命令:iostat 1 2

19)查看系统定时备份情况 命令:crontab –l

20)HACMP

检查Cluster是否运行正常

Cluster进程是否运行:#lssrc –g cluster,至少两个进程,且为active。

IP地址是否获取:#netstat –i,看boot IP是否变为service ip。

VG是否varyon:#lsvg –o

文件系统是否mount:#mount

应用进程是否启动:#ps –ef | grep app_name
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: