您的位置:首页 > 理论基础 > 计算机网络

一次奇葩网络故障排查历程

2017-12-03 23:02 686 查看
某天,突然有桌面维护人员反映某台终端网络正常,但一直都在用的视频监控客户端出现异常,每隔半个小时左右监控画面就会提示网络连接失败,关掉视频监控客户端重连又可以连上,但约半小时后又会重复提示异常。

视频服务全套采用海康设备,在外联下属各部门分别部署网络摄像头,然后通过专用网络传回总机房视频服务区下的NVR集中保存。在视频服务区部署两台WINDOWS SERVER 2008服务器,共同运行海康视频管理系统,一台服务器负责用户认证管理,一台服务器部署流媒体服务负责将NVR存储的视频分发到各客户端,视频区其他业务隐去不说。办公区域有部分终端需要实时监控部分摄像头视频,通过安装视频监控客户端方式获取视频。视频网络结构图如下:



接到反馈后,开始故障排查。
1.排查是否终端设置故障。在办公区其他终端安装视频监控客户端复核,发现故障依旧。
2.排查是否网络通信故障引起。
故障症状与网络会话超时故障现象非常相似,因此分别检查视频区和办公区的两个防火墙的长连接会话超时时间设置,确认均已启用长连接且超时时间远大于故障发生频率,可能性排除。
想不到其他可能的网络故障点,干脆直接在服务器上安装视频监控客户端来验证。于是远程到认证管理服务器并安装视频监控客户端,结果发现故障依旧,由此可以基本排除网络故障可能。
3.排查是否服务器设置故障。
仔细查看两台服务器运行的程序及服务,没有发现异常程序和服务,但流媒体服务器上运行有“鲁大师”,印象中之前并没有安装,但“鲁大师”过于常见,并未引起重视。故障排查到这里,感觉完全失去了方向,不知接下来从何查起。
抛开常见的可能,还有什么情况能引起这种故障呢?思考良久,突然福至心灵,WTF!
赶紧连上流媒体服务器,直奔“电源选项”:首选计划居然是“‘鲁大师’节能方案”!点开具体设置一看,居然给我设成了无操作20分钟后进入睡眠模式!WTF!
将电源选项改回“高性能”,卸载鲁大师(控制面板中根本找不到鲁大师,只能通过其他方式卸载),故障消失。

题外:
电源选项明显是由“鲁大师”自行更改的,但是鲁大师是怎么装上去的呢?在与维护人员沟通后,明确绝非维护人员安装。但某次为检查木马,曾经在此服务器安装过360安全卫士,但扫完后就卸载了。鉴于“鲁大师”被360收购已久,由此答案已经若隐若现了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  网络排障