您的位置:首页 > 理论基础 > 计算机网络

网络异常检查

2014-06-14 17:00 267 查看
一、本文目的

在涉及网络编程的实际项目应用中,由于网络不可能一直处于理想状态,TCP长连接也可能随时正常或异常地断开,如果不予处理,那么就可能因此而给程序带来很多潜在的问题。 编写该文档的目的就在于针对网络程序中可能遇到的各种问题,拿出来与大家探讨一下具体问题的解决方案,同时本人将前期调研的一些解决方案列出来,抛砖引玉,希望可以集思广益,寻求到更加合理的解决方案。

二、网络断开时机

1、正常网络断开

(1) CS 一方调用 Close

(2) CS 一方程序正常退出,如Ctrl + C 事件可以被系统检测到,对应的套接字也将被系统标记为已断开。

2、异常网络断开

(1) CS 一方网线被拨出

(2) CS 之间路由故障,物理连接断开

(3) CS 一方断电或当机

(4) CS 一方无线信号不佳或无线接口被关闭

(5) CS 一方更改 IP 事件无法被系统检测到,这个时候读数据不会出错,只会一直阻塞着;写数据在缓冲区未满之前也不会返回错误。若无法及时检测到断开事件,对某些应用场景而言可能存在致命的错误。如服务端维护的客户端在线信息错误等。

三、网络断开常用检测方法

1、处理正常网络断开

(1) select 捕捉可读事件,read返回0

(2) epoll 捕捉可读事件,read返回0

(3) 主动 read 返回错误

(4) 主动 write 返回错误

2、处理异常网络断开

(1) 应用层KeepAlive检测

在应用层协议加入心跳握手机制,维护服务端跟客户端之间的连通状态,是最普遍最保险的办法。 客户端定时向服务端发送探测包,若服务端回应则说明服务端在线,否则作离线处理;服务端也可对长期未发送探测包的客户端作离线处理。 该方案所有系统都支持,跨平台性好;对端跟自身出现网络故障都能检测到。不足之处在于它需要应用层协议支持,程序内部需要长期维护心跳握手包,相对比较繁琐。

(2) 传输层KeepAlive检测

除了应用层 KeepAlive 检测机制外,TCP 内部也集成了 KeepAlive 机制,默认关闭,开启它很方便。对端跟自身出现网络故障都能检测到。但不是所有的系统都支持,而且有些系统虽然支持但会影响到所有套接字,消耗额外的宽带和流量,不建议使用。

//启用心跳机制,如果您想关闭,将keepAlive置零即可
setsockopt(fd,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive));
//启用心跳机制开始到首次心跳侦测包发送之间的空闲时间
setsockopt(fd,SOL_TCP,TCP_KEEPIDLE,(void *)&start,sizeof(start));
//两次心跳侦测包之间的间隔时间
setsockopt(fd,SOL_TCP,TCP_KEEPINTVL,(void *)&interval,sizeof(interval));
//探测次数,即将几次探测失败判定为TCP断开
setsockopt(fd,SOL_TCP,TCP_KEEPCNT,(void *)&count,sizeof(count));


(3) 网络层KeepAlive检测

Ping 命令几乎是所有平台的网络连通性检测命令,走网络层 ICMP 协议,这里考虑使用 popen 函数调用系统自带的 Ping 命令来封装网络连通性检测函数。它实际上也是一种网络层的 KeepAlive 机制。
int checkConnect(char *dst, int cnt)
{
FILE *stream;
sprintf(cmdBuf, "ping %s -c %d -i 0.2 | grep time= | wc -l", dst, cnt);
stream = popen(cmdBuf, "r");
fread(recvBuf, sizeof(char), sizeof(recvBuf)-1, stream);
pclose(stream);
if (atoi(recvBuf) > 0) return 0;
return -1;
}


dst 指定要检测的目的地址,cnt 指定 Ping 尝试的次数,-i 参数指定 Ping 尝试的超时时间。

(4) 应用层监控内核消息机制

Netlink 是一种特殊的套接字,为2.6.14及更高版本的Linux所特有,通过它,应用层程序可以方便地向内核订制指定消息,如网卡上下线。也可以设置或查询配置,如IP、路由、网络流量信息等。

a、创建一个 netlink 套接字:
fd = socket(AF_NETLINK, SOCK_RAW, NETLINK_ROUTE);
b、绑定路由多播组,监控网卡信息:

addr.nl_family = AF_NETLINK;
addr.nl_groups = RTNLGRP_LINK; //指定接收路由多播组消息
bind(fd, (struct sockaddr*)&addr, sizeof(addr));


c、监听套接字,一旦可读,解析其内容,实时监控网卡上下线事件。

优点:实时性高,使用方便。

缺点:跨平台性不佳,只能检测自身网络故障。

(5) 应用层网卡信息轮询机制

网卡信息轮询机制就是定期调用 ioctl 函数执行如下操作:

struct ifconf ifc;
struct ifreq ifrcopy;
//获取网卡信息列表
ioctl(fd, SIOCGIFCONF, (char *)&ifc);
//获取网卡上下线状态
ioctl(fd, SIOCGIFFLAGS, &ifrcopy);
//获取 MAC 地址
ioctl(fd, SIOCGIFHWADDR, (char *)(&ifrcopy);
//获取 IP 地址
ioctl(fd, SIOCGIFADDR, (char *)&ifrcopy);
//获取广播地址
ioctl(fd, SIOCGIFBRDADDR, &ifrcopy));


缺点:

a、跨平台性不佳。

可以成功移植到 Linux、Android、Windows平台,但由于 iPhone 平台上获取MAC跟IP的参数不同,需特殊处理。

b、实时性跟灵活性不高。

c、耗费资源,影响性能。

d、只能检测自身网络故障。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: