Zabbix 监控 AlwaysOn
2017-12-13 13:51
531 查看
基于生产环境 SQL Server 业务数据库的特性,需要针对 SQL Server 生产环境几组 AlwaysOn AG 的 Primary Replica 部署如下监控:
1. Windows集群节点不正常
2. 任一业务数据库没加入可用性组
3. AG中任一数据库状态异常
4. 任一数据库延时超过阈值
1. primary replica 检查Windows集群状态不正常的节点数(>0 告警)
2. primary replica 检查副本可用数据库个数 与 需要加入AG的业务数据库数 对比 (<后者告警)
3. primary replica 检查任一数据库状态异常(>0 告警)
4. primary replica 检查任一数据库延时(>900 告警)
Zabbix参数配置示例:
UserParameter=MSSQL.SyncHealth,"C:\Program Files\Microsoft SQL Server\Client SDK\ODBC\110\Tools\Binn\SQLCMD.EXE" -d Master -U zabbix -P zabbix -h -1 -W -Q "SELECT COUNT (*) as NotHealtyCount
FROM [master].[sys].[dm_hadr_database_replica_states]
WHERE [synchronization_health_desc] != N''HEALTHY''
"
建议,将1、3、4项配置为模板,2项需要单独配置4个参数。
1. Windows集群节点不正常
2. 任一业务数据库没加入可用性组
3. AG中任一数据库状态异常
4. 任一数据库延时超过阈值
1. primary replica 检查Windows集群状态不正常的节点数(>0 告警)
SELECT COUNT (*) as NotHealtyCount FROM sys.dm_hadr_cluster_members WHERE member_state_desc !='UP';
2. primary replica 检查副本可用数据库个数 与 需要加入AG的业务数据库数 对比 (<后者告警)
SELECT COUNT(*) as DBCount FROM sys.availability_databases_cluster;
3. primary replica 检查任一数据库状态异常(>0 告警)
SELECT COUNT (*) as NotHealtyCount FROM [master].[sys].[dm_hadr_database_replica_states] WHERE [synchronization_health_desc] != N'HEALTHY'
4. primary replica 检查任一数据库延时(>900 告警)
;WITH AG_Stats AS ( SELECT AR.replica_server_name, HARS.role_desc, Db_name(DRS.database_id) [DBName], DRS.last_commit_time FROM sys.dm_hadr_database_replica_states DRS INNER JOIN sys.availability_replicas AR ON DRS.replica_id = AR.replica_id INNER JOIN sys.dm_hadr_availability_replica_states HARS ON AR.group_id = HARS.group_id AND AR.replica_id = HARS.replica_id ), Pri_CommitTime AS ( SELECTreplica_server_name , DBName , last_commit_time FROMAG_Stats WHERErole_desc = 'PRIMARY' ), Sec_CommitTime AS ( SELECTreplica_server_name , DBName , last_commit_time FROMAG_Stats WHERErole_desc = 'SECONDARY' ) SELECT ISNULL(DATEDIFF(ss,s.last_commit_time,p.last_commit_time),0) AS [Sync_Lag_Secs] FROM Pri_CommitTime p LEFT JOIN Sec_CommitTime s ON [s].[DBName] = [p].[DBName]
Zabbix参数配置示例:
UserParameter=MSSQL.SyncHealth,"C:\Program Files\Microsoft SQL Server\Client SDK\ODBC\110\Tools\Binn\SQLCMD.EXE" -d Master -U zabbix -P zabbix -h -1 -W -Q "SELECT COUNT (*) as NotHealtyCount
FROM [master].[sys].[dm_hadr_database_replica_states]
WHERE [synchronization_health_desc] != N''HEALTHY''
"
建议,将1、3、4项配置为模板,2项需要单独配置4个参数。
相关文章推荐
- (4)使用zabbix监控web
- Zabbix通过SNMPv2监控DELL服务器的硬件信息
- zabbix 监控windows下kafka
- ZABBIX企业监控实践(1):ZABBIX详细部署过程 推荐
- zabbix监控之redis自动发现并监控
- Zabbix监控Linux主机设置
- zabbix监控linux服务器的磁盘I/O
- zabbix 监控Windows client
- zabbix3.0 监控mysql服务免用户名密码登录的问题故障处理详细过程
- python利用zabbix API添加监控
- 分布式监控系统Zabbix--完整安装记录 -添加apache监控
- zabbix 自定义监控
- 开源监控解决方案:zabbix 监控oracle database(一)
- 结合Zabbix与Ansible打造自动化数据库监控体系 - 更多
- 【zabbix教程四】——zabbix3.0监控磁盘IO与自定义模板
- zabbix监控两台文件的md5值是否一致
- python实现Zabbix-API监控
- Ubuntu 12.04环境下使用Zabbix监控Apache的配置过程
- 通过Android软件ZAX实时查看Zabbix监控