您的位置:首页 > 运维架构

Tiptop系统日常监控维护

2018-03-07 15:54 113 查看
|一、网络监控 (可分别在AP和DB服务器上)1、 从各个外点使用 ping 命令判断网络的连通性。在数据库服务器和应用服务器正常运行时,在各个外点的Windows客户端分别键入以下命令:l         ping 192.168.0.135 –n 300 –L 1024说明如下:l         如果一台服务器 ping 不通,请改 ping 另外一台服务器,如果两台服务器都 ping 不通,则很可能是网络l         两条命令的作用不尽相同,发送到服务器的数据包大小不同,用于简单测试在不同网络需求的响应l         可以从 ping 的返回结果,看到丢包率,看到网络稳定状况(平均值Average 越接近最小值 Minimum 则网络越稳定)
C:\>ping 192.168.0.135 -n 300 -l 1024
……………………
Ping statistics for 192.168.0.135:
    Packets: Sent = 300, Received = 300, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
    Minimum = 3ms, Maximum = 13ms, Average = 3ms
从这个结果可以看到,发送1024字节的数据包的测试,丢包率为零,响应时间平均为3毫秒,最小为3毫秒。二、数据库监控(在DB服务器上)1、数据库启动状态以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):$ ps  -ef | grep ora_2、数据库监听服务状态以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):$ lsnrctl status说明如下:客户端访问 Oracle 数据库必须通过监听服务,故此如果监听服务没有启动,则直接影响易拓系统的运行。启动监听服务的命令为:$ lsnrctl start  3、数据库连接状态以 oracle 身份登录系统,输入以下命令   ( “$” 表示系统提示符):$ sqlplus ds/ds_password@topprod说明如下:此命令为通过网络服务登录到 Oracle 数据库,如果用户名和密码正确的情况下不能登录到系统,则说明无法通过网络服务方式登录到数据库,易拓系统无法运行。 4、查看数据库运行日志以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):$ vi  /u2/oracle/9i/network/log/listener.log $ > /u2/oracle/9i/network/log/listener.log    ( 清空日志 )$ vi  /u2/oradb/admin/topprod/bdump/alert_topprod.log$ > /u2/oradb/admin/topprod/bdump/alert_topprod.log   ( 清空日志 ) 5、查看数据库表空间使用情况    以 tiptop 身份登录系统$ oraq  q_tbsFREE         ( 根据提示输入system密码)6、查看数据库表被锁情况情况$ oraq  q_locktables         ( 根据提示输入system密码) 三、操作系统监控1、确认计划任务服务是否已经启动以 root 身份登录到系统,检查 crond 服务是否已经在运行# service crond status说明:如果 crond 服务没有启动,则每天的自动备份无法调度。 2、查看各文件系统的使用情况# df  –h说明:保证各个关键的文件系统有足够支持运行的空间,如/,/data,/u1,/u2,/backup,/tmp,/repout 等等。 3、查看报表输出目录使用情况在 Application Server 上输入以下命令:cd  /repoutdu  –sh说明:若发现此目录占用的空间超过2GB, 请先备份目录的内容,再使用rm 命令清空目录,否则会影响程序运行过程中的报表的产生。 4、系统性能使用top命令查看系统资源使用情况,对长时间占用CPU资源较高的进程,要找出原因,及时清除占用资源较高的死进程,确保系统运行顺畅。 5、检查系统日志和目录使用情况,命令如下:# vi  /var/log/messages          --可查看系统运行日志# cd  /var# du  -sh  log  clientmqueue     --查看目录使用情况对于log目录下文件要做好备份再使用下面命令清空文件#  > 文件名   如:# > messages对于clientmqueue目录下文件可使用rm删除即可 四、系统备份检查1、检查前一天的备份是否成功查看硬盘备份的目录/backup/exp                 每天定时备份的数据库/backup/source            每天定时备份的程序说明:数据库备份和程序备份一般是每天一次,并会在备份的文件名后面加上日期的描述,如 Mon, Tue 等等,故此备份会保留7天。 查看磁带备份情况tar tvf /dev/st0 2、检查关键用户的计划任务设置       分别使用 root 和 oracle 身份登录系统,输入以下命令:       $ crontab  –l说明:可以从这里看到这些用户的计划任务设置,root 用户应该有backup_source.sh 的命令,而 oracle 用户应该有 backup_db.sh 的命令,如果缺了这两个命令,则无法时间定时备份。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: