您的位置:首页 > 运维架构

Tiptop系统日常监控维护

2014-10-24 11:14 501 查看


                                   Tiptop系统日常监控维护  

|举报|字号 订阅

一、网络监控 (可分别在AP和DB服务器上)

1、 从各个外点使用 ping 命令判断网络的连通性。
在数据库服务器和应用服务器正常运行时,在各个外点的Windows客户端分别键入以下命令:

l         ping 192.168.0.135 –n 300 –L 1024
说明如下:

l         如果一台服务器 ping 不通,请改 ping 另外一台服务器,如果两台服务器都 ping 不通,则很可能是网络

l         两条命令的作用不尽相同,发送到服务器的数据包大小不同,用于简单测试在不同网络需求的响应

l         可以从 ping 的返回结果,看到丢包率,看到网络稳定状况(平均值Average 越接近最小值 Minimum 则网络越稳定)

C:\>ping 192.168.0.135 -n 300 -l 1024

……………………

Ping statistics for 192.168.0.135:

    Packets: Sent = 300, Received = 300, Lost = 0 (0% loss),

Approximate round trip times in milli-seconds:

    Minimum = 3ms, Maximum = 13ms, Average = 3ms
从这个结果可以看到,发送1024字节的数据包的测试,丢包率为零,响应时间平均为3毫秒,最小为3毫秒。

二、数据库监控(在DB服务器上)
1、数据库启动状态

以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):
$ ps  -ef | grep ora_

2、数据库监听服务状态

以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):
$ lsnrctl status

说明如下:
客户端访问 Oracle 数据库必须通过监听服务,故此如果监听服务没有启动,则直接影响易拓系统的运行。
启动监听服务的命令为:
$ lsnrctl start
 
 
3、数据库连接状态

以 oracle 身份登录系统,输入以下命令   ( “$” 表示系统提示符):

$ sqlplus ds/ds_password@topprod

说明如下:
此命令为通过网络服务登录到 Oracle 数据库,如果用户名和密码正确的情况下不能登录到系统,则说明无法通过网络服务方式登录到数据库,易拓系统无法运行。
 
4、查看数据库运行日志

以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):

$ vi  /u2/oracle/9i/network/log/listener.log 

$ > /u2/oracle/9i/network/log/listener.log    ( 清空日志 )

$ vi  /u2/oradb/admin/topprod/bdump/alert_topprod.log

$ > /u2/oradb/admin/topprod/bdump/alert_topprod.log   ( 清空日志 )

 
5、查看数据库表空间使用情况
    以 tiptop 身份登录系统
$ oraq  q_tbsFREE         ( 根据提示输入system密码)

6、查看数据库表被锁情况情况
$ oraq  q_locktables         ( 根据提示输入system密码)

 

三、操作系统监控
1、确认计划任务服务是否已经启动
以 root 身份登录到系统,检查 crond 服务是否已经在运行
# service crond status
说明:如果 crond 服务没有启动,则每天的自动备份无法调度。
 
2、查看各文件系统的使用情况

# df  –h

说明:保证各个关键的文件系统有足够支持运行的空间,如/,/data,/u1,/u2,/backup,/tmp,/repout 等等。

 
3、查看报表输出目录使用情况
在 Application Server 上输入以下命令:

cd  /repout

du  –sh
说明:若发现此目录占用的空间超过2GB, 请先备份目录的内容,再使用rm 命令清空目录,否则会影响程序运行过程中的报表的产生。
 
4、系统性能
使用top命令查看系统资源使用情况,对长时间占用CPU资源较高的进程,要找出原因,及时清除占用资源较高的死进程,确保系统运行顺畅。
 
5、检查系统日志和目录使用情况,命令如下:
# vi  /var/log/messages          --可查看系统运行日志
# cd  /var
# du  -sh  log  clientmqueue     --查看目录使用情况
对于log目录下文件要做好备份再使用下面命令清空文件
#  > 文件名   
如:# > messages
对于clientmqueue目录下文件可使用rm删除即可
 

四、系统备份检查
1、检查前一天的备份是否成功

查看硬盘备份的目录

/backup/exp                 每天定时备份的数据库

/backup/source            每天定时备份的程序
说明:数据库备份和程序备份一般是每天一次,并会在备份的文件名后面加上日期的描述,如 Mon, Tue 等等,故此备份会保留7天。
 

查看磁带备份情况

tar tvf /dev/st0

 
2、检查关键用户的计划任务设置
       分别使用 root 和 oracle 身份登录系统,输入以下命令:
       $ crontab  –l
说明:可以从这里看到这些用户的计划任务设置,root 用户应该有backup_source.sh 的命令,而 oracle 用户应该有 backup_db.sh 的命令,如果缺了这两个命令,则无法时间定时备份。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: