您的位置:首页 > 产品设计 > UI/UE

像MIUI一样做Zabbix二次开发(7)——问答

2018-01-22 00:37 429 查看
Q:用Zabbix怎么去监控IBM的power服务器(硬件方面的)

A:硬件监控,ipmi 和SNMP,带外管理口集成

Q:ipmi获取数据有时候回拉不到

A:ipmi的监控zabbix低版本的的确轮训会很差,有这个问题,Zabbix在升级版本中也一直对这块做了优化,尽量用高版本的Zabbix

Q:ipmi 监控IBM服务器硬件的时候经常获取不到数据,监控效果很差

A:是的,Zabbix的每个版本都有所优化,ipmi也有相应的配置参数,相对调整也可以加快轮训

Q:业务监控怎么做的

A:我们是分两层做的,一个业务本身可用性监控,一个是依赖监控,然后建立关系

Q:有用容器做Zabbix-server进程的案例吗?

A:有,做过

Q:业务数据怎么做

A:业务数据需要单独做,我们通常是独立做一个应用再与我们的平台集成,集成主要在显示层

Q:Oracle的监控,能详细说说吗

A:我们让DBA独立写的监控脚本,放弃了orabbix

Q:zabbix案例中最多监控多少设备?实施

A:看item

Q:你们代码开源了吗?

A:我们研发了很久,投入很大,代码暂时不开源,计划明年开放一部分功能

Q:老师你好,能讲讲Zabbix对docker容器的监控方案吗?

A:基本:运行状态数量、统计数量、版本、暂停状态数量、停止状态数量

自动发现:IO读写操作字节数、容器状态、CPU使用率百分比、磁盘使用、内存限制值、内存使用率、网络收发字节、总缓存、交换分区、运行时间等等

Q:Zabbix Server作为监控处理中心,怎么做高可用?

A:WEB层,DB层,Proxy,层层实现,建议做一层冷备

Q:请问,如何做预警?

A:3.0以上就已经有这个功能了,通过类似Forecast这样的函数实现,Forecast

Q:这两个函数效果一般,有没有更好的办法?

A:原生的只要这两个,可以结合多种表达式做优化。

Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗

A:现在还不行,trigger还是静态的,需要做二次开发

Q:您好!如何把不同的磁盘分区报警发给不同的人,如WebLogic分区告警发给中间件管理员,oracle分区报警发给数据库管理员,有什么好办法吗?

A:通过告警和报表订阅实现,Zabbix原生还没有

Q:容器上跑Zabbix-server的坑能讲讲吗?

A:我们2015年用docker跑过,发现了一些问题,比如说JDBC当时没有提供,监控不了数据库,最近的版本还没有尝试。

Q:Zabbix-server的高可用,一般用什么组件实现?zookeeper?keepalive?还是其他的?

A:我们用keepalive

Q:刚才你提到的IBM的小机的带外管理口是指HMC管理口吗

A:是的,拿Zabbix监控硬件需要掌握原厂的MIB库

Q:请介绍下如何做告警收敛的?

A:我们做了管理上的收敛,Zabbix原生可以配置告警依赖,另外触发器事件模式配置单重等,计划未来在实践不尝试去做告警的智能收敛,这个步骤我们会相对谨慎,宁可适当多发,也不漏发,避免影响监控的覆盖率和准确率

Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗,有结合一些数据挖掘算法的案例吗

A:需要二开

Q:Zabbix和自动化部署工具,如salt集成有这方面的经验吗?

A:做过一些测试,使用salt自动部署需要解决的问题

1. rpm包的打包(这个问题不大,官方有提供)

2. rpm 安装(pkg模块)

3. 配置文件调整(file模块)

4. 服务自启动(service)

5. 配置文件的适配(使用salt的pillar实现)

基本上涉及salt的pkg(包管理模块)、file(文件管理模块)、service(服务管理模块)、pillar模块这四个模块。

Q:Zabbix的版本升级有没有坑?

A:按官方提示操作,逐渐升级版本

1. 不建议跨版本升级,因为版本间可能有表字段的变更,版本跨越太大可能导致系统无法运行

2. 如果非要跨版本升级的话,建议将主机和模板导出,部署完再做导入

3. 如果不是研究的话,版本升级不建议太激进
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息