您的位置:首页 > 其它

CRS 诊断数据收集:常见工具及其用法摘要 (Doc ID 1526158.1)

2014-01-12 08:23 483 查看


适用于:

Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [发行版 10.2 到 11.2]

本文档所含信息适用于所有平台


用途

本文档提供了用于诊断 CRS/GRID 问题的工具的快速指南。


适用范围

本文档的目标受众是需要诊断 CRS/Grid Infrastructure 问题的 DBA,或者您希望事先监控集群,以确保在遇到 CRS 问题时,能够得到所需的从问题发生之后的诊断信息。


详细信息

为了充分利用问题调查工具,应在RAC 服务器所有节点上安装如下工具:

远程诊断代理 [RDA]
OS Watcher 或 Cluster
Health Monitor
Procwatcher
默认情况下,以下工具会在 CRS/Grid 安装时自动安装:

diagcollection.pl (10gR2 及更高版本)
Cluvfy utility

此外,如下工具也非常有用:

RACcheck
RAC 数据库跟踪文件和 core dumps
CRS debug 设置
OUI 跟踪
系统消息文件
本文档提供了有关这些工具的功能和用法的简要概述。


远程诊断代理 [RDA]

此工具收集安装、配置、日志文件和性能数据。

有关如何下载和运行 RDA 的信息,请参阅 Document 314422.1 Remote Diagnostic Agent (RDA) 4 - Getting Started

要使用 RDA 中的自动化全节点收集功能,请参阅 Document 359395.1 Diagnostics Agent (RDA) for RAC Cluster

要运行 RDA:

将当前目录更改为安装目录。

如果 Perl 可用:

./rda.pl 

如果 Perl 不可用:

./rda.sh
如果访问 perl 时出现问题,则使用以下命令验证 Perl 已安装并可用:

perl -V 
检查命令输出,检查 “.”(即当前目录)是否在 @INC 部分中。

RDA 使用当前目录中的 setup.cfg 文件设置数据收集环境参数。如果一个服务器上有多个实例,则可能需要针对一个非安装时指定的实例运行 RDA。如果提供的 setup.cfg 文件不适用于当前数据库,则:

mv setup.cfg setup_copy_<date>.cfgbak 

./rda.pl 

or 

./rda.sh 

根据您的环境响应提示,以创建新的 setup.cfg 

运行 RDA 

恢复原始 setup.cfg(或验证更改是可接受的):

mv setup.cfg setup_$ORACLE_SID_<date>.cfgbak 

mv setup_copy_<date>.cfgbak setup.cfg
输出生成在安装步骤指定的目录中。输出目录将包括一个包含所有生成文件的 zip 文件。该文件就是应上载至服务请求的文件。

 


OS Watcher / Cluster Health Monitor

这些工具旨在收集 OS 性能统计信息。


OS Watcher (OSW)

OS Watcher (OSW) 是一组 UNIX shell 脚本的集合,主要用于收集和归档操作系统和网络的统计信息,以便为诊断性能问题提供支持。OSW 作为服务器上的一组后台进程运行,定期收集 OS 数据,调用 vmstat、netstat 和 iostat 等 Unix 实用程序。

更多详细信息,请参阅:
Document 301137.1 OS Watcher User Guide
Document 461053.1 OSWatcher Black Box Analyzer User Guide 
Document 433472.1 OS Watcher For Windows (OSWFW) User Guide.  

可以从 osw 安装目录中手动收集 OS Watcher 输出或压缩后的输出。  

可以从 osw 安装目录中手动启动数据收集:

nohup ./startOSW.sh 15 24 &
OS Watcher 应位于 init.d 中,以确保在服务器重新引导时自动启动。

tarupfiles.sh 脚本应当定期运行,以压缩 OS watcher 数据收集输出。应配置在 crontab 中。


Cluster Health Monitor (CHM)

在版本 11.2 中,Instantaneous Problem Detection OS Tool(IPD/OS)已经过修改并更名为 Cluster Health Monitor(CHM,集群健康监视器)。Cluster Health Monitor 收集 OS 统计信息(系统度量),如内存和交换空间的使用、进程、IO 的使用和网络相关的数据。Cluster Health Monitor 实时收集信息且通常每秒收集一次。Cluster Health Monitor 使用 OS API 收集 OS 统计信息,以提高性能并降低
CPU 的使用开销。Cluster Health Monitor 在本工具所消耗资源的可接受级别限制内,收集尽可能多的系统度量和数据。

有关 CHM 的更多信息,请参阅以下文章:

Document 1328466.1 Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)
Document 811151.1 - How to install Oracle Cluster Health Monitor (former IPD/OS) on Windows


ProcWatcher

这是一个为 Oracle 进程收集堆栈跟踪信息的实用程序。对于 CRS 进程,必须以 root 用户身份运行,以拥有足够的权限监视 root 用户拥有的 CRS 进程。除非专门要求,否则使用以下文档中给出的步骤进行监视时不应包括 ocssd 进程。

Procwatcher 用户指南,请参阅:
Document 459694.1 Procwatcher: Script to Monitor and Examine Oracle and CRS Processes

启动 Procwatcher:

./prw.sh start 2
停止 Procwatcher:

./prw.sh stop
检查 Procwatcher 状态:

./prw.sh stat
 


diagcollection.pl: CRS 日志文件

CRS 10.2 及更高版本中提供了 diagcollection.pl 脚本。对于之前版本: Document 360926.1 提供了针对 RAC 版本 10.2 之前、10.2 及更高版本收集数据的详细信息。

CRS 日志可通过运行 $CRS_HOME/bin/diagcollection.pl 脚本(11.2 及更高版本中为 diagcollection.sh)收集。

要收集所有文件,diagcollection 必须以 root 用户身份运行。要成功运行 diagcollection,具体命令视版本而定。请参阅 Document 330358.1 了解每个版本的语法。

Unix/Linux 上的 10gR2 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs 

export ORACLE_BASE=/u01/app/oracle 

export HOSTNAME=racdb01 

$ORA_CRS_HOME/bin/diagcollection.pl -collect
Unix/Linux 上的 11gR1 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs 

$CRS_HOME/bin/diagcollection.pl -crshome $CRS_HOME --collect
Unix/Linux 上的 11gR2 的 diagcollection.pl 命令示例:

$GRID_HOME/bin/diagcollection.sh 

$GRID_HOME/bin/diagcollection.sh --adr /tmp/collect -beforetime 20120218100000 --aftertime 20120218050000

$GRID_HOME/bin/diagcollection.sh -chmos --incidenttime 02/18/201205:00:00 --incidentduration 05:00
Windows 上的 diagcollection.pl 命令示例:

set ORACLE_HOME=D:\oracle\ora102db 

set ORA_CRS_HOME=D:\oracle\ora102crs 

set ORACLE_BASE=D:\oracle 

%ORA_CRS_HOME%\bin\diagcollection.pl --collect
注意:在 Windows 中运行 diagcollection 前,可能需要添加 perl 至环境变量 PATH。

请查看 Document 330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide.

运行 diagcollection 将生成四个输出文件,包括配置和日志信息:

 crsData_<hostname>.tar.gz 

 ocrData_<hostname>.tar.gz 

 oraData_<hostname>.tar.gz 

 osData_<hostname>.tar.gz

 


Cluvfy 实用程序

CVU 是随 Oracle Clusterware 提供的实用程序。开发此程序是为了帮助安装和配置 Oracle Clusterware 和 RAC。CVU 将验证配置 RAC 环境不同阶段所需的所有重要组件。CVU 提供的验证范围很广,从 RAC 部署的初始硬件设置到已经正常运行的集群,涵盖各种组件的安装和配置的所有中间阶段。命令行工具为 cluvfy。Cluvfy 是非侵入式实用程序,且不会对系统或集群产生不利影响。

使用以下命令,验证已安装的 RAC 集群的配置:

cluvfy stage -post crsinst -n all -verbose
可以从 OTN 下载 cluvfy 的最新版本:
http://www.oracle.com/technology/products/database/clustering/cvu/cvu_download_homepage.html

请参阅 Document 316817.1 Cluster Verification Utility (CLUVFY) FAQ

 


通用附加数据收集


RACcheck - RAC 配置审核工具

RACcheck 是一款 RAC 配置审核工具,主要用于审核 Real Application Clusters (RAC)、Oracle Clusterware (CRS)、Automatic Storage Management (ASM) 和 Grid Infrastructure 环境中各个重要配置的设置。此工具审核以下类别配置的设置:

OS 内核参数
OS 软件包
其他许多对于 RAC 比较重要的 OS 配置设置。
CRS/Grid Infrastructure
RDBMS
ASM
数据库初始化参数
其他对 RAC 非常重要的数据库配置
11.2.0.3 升级就绪评估
有关更多信息,请参阅 Document 1268927.1.


RAC 数据库跟踪文件

如果问题涉及数据库,请收集以下信息:

收集问题出现期间在 $ORACLE_BASE/admin/$ORACLE_SID/bdump 中生成的所有跟踪文件,或数据库告警日志中提到的有关的所有跟踪文件。
收集 $ORACLE_BASE/admin/$ORACLE_SID/udump 中生成的所有 SQL 跟踪输出
请参阅 Document 289690.1 Data Gathering for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application
Cluster (RAC) Issues 了解详细信息


CRS debug 设置

以下 debug 说明仅适用于 10.2 及以上版本。

1. srvctl 

要生成 srvctl 命令跟踪信息,应设置以下环境变量:

EXPORT SRVM_TRACE=TRUE
2. CRS/EVM/CSS 和 CRS 资源


请参阅 Document 357808.1 Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource 了解如何收集 CRS 组件的 debug 信息。


Oracle Universal Installer

请参阅 Document 784667.1 What are the debugging options in OUI?


系统消息文件位置:

各平台的系统日志位于以下特定位置:

Linux: /var/log/messages
Sun: /var/adm/messages
HP-UX: /var/adm/syslog/syslog.log
Tru64: /var/adm/messages
AIX: /bin/errpt -a
Windows: 使用事件查看器将应用程序日志和系统日志保存为 .TXT 文件,确保获取重启后的日志。


Veritas 日志文件位置:

/var/VRTSvcs/log/engine_A.log


REFERENCES

NOTE:330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide
NOTE:357808.1 - Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource
NOTE:359395.1 - Remote Diagnostic Agent (RDA) - RAC Cluster Guide
NOTE:433472.1 - OS Watcher For Windows (OSWFW) User Guide
NOTE:459694.1 - Procwatcher: Script to Monitor and Examine Oracle DB and Clusterware Processes
NOTE:784667.1 - What are the debugging options in OUI?
NOTE:135714.1 - Script to Collect RAC Diagnostic Information (racdiag.sql)
NOTE:1328466.1 - Cluster Health Monitor (CHM) FAQ
NOTE:289690.1 - Data Collecting for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues
NOTE:811151.1 - How to Install Oracle Cluster Health Monitor (former IPD/OS) on Windows
NOTE:1268927.1 - RACcheck - RAC Configuration Audit Tool
NOTE:301137.1 - OSWatcher Black Box (Includes: [Video])
NOTE:316817.1 - Cluster Verification Utility (CLUVFY) FAQ
NOTE:314422.1 - Remote Diagnostic Agent (RDA) - Getting Started

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Oracel RAC GRID tools