F5 LTM ping 数据包丢包解决过程
2008-06-08 20:54
190 查看
F5 LTM ping 数据包丢包解决过程
一. 验证确实是 F5 LTM 丢包
用户在交换机上 ping 了 1000 个包,我想知道这 1000 个包是否都到达了我们的 F5 LTM,而且我们的 F5 是否都回包了,也就是想证明到底是我们的 F5 丢包还是其他网络设备丢包:
1) 抓包并保存到文件 a.txt:
[root@standby:Active] config # tcpdump -i internal host x.x.x.x and icmp > a.txt
2) 计算抓到的 PING 数据包中,请求包是多少个:
[root@standby:Active] config # cat a.txt | grep request | wc -l
1000
3) 计算抓到的 PING 数据包中,响应包是多少个:
[root@standby:Active] config # cat a.txt | grep reply | wc -l
947
4) 结论:确实是我们的 F5 LTM 丢包。
5) 查看日志,进一步确认 F5 为啥丢弃 ICMP 包:
# grep -i icmp /var/log/ltm
.......
Jun 3 10:02:29 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 306 to 250 packets/sec
Jun 3 10:02:30 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 378 to 250 packets/sec
Jun 3 10:02:32 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 460 to 250 packets/sec
Jun 3 10:02:33 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 459 to 250 packets/sec
Jun 3 10:02:34 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 319 to 250 packets/sec
Jun 3 10:02:36 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 425 to 250 packets/sec
Jun 3 10:02:37 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 384 to 250 packets/sec
Jun 3 10:02:38 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 516 to 250 packets/sec
Jun 3 10:02:39 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 495 to 250 packets/sec
Jun 3 10:02:41 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 439 to 250 packets/sec
Jun 3 10:02:43 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 401 to 250 packets/sec
......
可以看出,由于 F5 LTM 默认每秒钟只处理 250 个 ICMP 包,超过的 ICMP
包将被丢弃。
6) 修改这个默认值,解决问题:
[root@standby:Active] log # b db | grep Reject ;查看当前值
二. 修改控制 F5 LTM 每秒最多处理多少 ICMP 包的参数
[root@standby:Active] log # b db TM.MaxRejectRate 1000 ;修改
[root@standby:Active] log # b db | grep Reject ;查看修改是否生效
7) 查看 /config/BigDB.conf 文件,确认其 TM.MaxRejectRate 值已经修改为 1000 了。
三. 验证问题是否确实已经解决
让客户管理员再次从交换机 ping F5 LTM 的 虚拟服务器 IP,问题解决了。
四. 相关 Linux 命令介绍
[align=left]8) 几个 Linux 命令介绍:
tcpdump -i <指定抓取达到或者通过哪个接口的数据包,一般指定 VLAN 接口> \
host <指定抓取的数据包源地址或者目标地址> \
and <icmp | port <指定抓取数据包的端口号> ; icmp 指定只抓取 ICMP 数据包
cat <希望查看其内容的文件名> ;一下子显示一个文件的内容
less, more <希望查看其内容的文件名> ;逐屏显示一个文件的内容
grep -i <字符串> <文件名> ;显示 文件 里面包含了 字符串 的那些行
; -i 表示忽略大小写
wc -l <希望计算其行数的文件名> ;显示一个文件的行数
[/align]
附件:http://down.51cto.com/data/2350073
一. 验证确实是 F5 LTM 丢包
用户在交换机上 ping 了 1000 个包,我想知道这 1000 个包是否都到达了我们的 F5 LTM,而且我们的 F5 是否都回包了,也就是想证明到底是我们的 F5 丢包还是其他网络设备丢包:
1) 抓包并保存到文件 a.txt:
[root@standby:Active] config # tcpdump -i internal host x.x.x.x and icmp > a.txt
2) 计算抓到的 PING 数据包中,请求包是多少个:
[root@standby:Active] config # cat a.txt | grep request | wc -l
1000
3) 计算抓到的 PING 数据包中,响应包是多少个:
[root@standby:Active] config # cat a.txt | grep reply | wc -l
947
4) 结论:确实是我们的 F5 LTM 丢包。
5) 查看日志,进一步确认 F5 为啥丢弃 ICMP 包:
# grep -i icmp /var/log/ltm
.......
Jun 3 10:02:29 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 306 to 250 packets/sec
Jun 3 10:02:30 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 378 to 250 packets/sec
Jun 3 10:02:32 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 460 to 250 packets/sec
Jun 3 10:02:33 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 459 to 250 packets/sec
Jun 3 10:02:34 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 319 to 250 packets/sec
Jun 3 10:02:36 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 425 to 250 packets/sec
Jun 3 10:02:37 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 384 to 250 packets/sec
Jun 3 10:02:38 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 516 to 250 packets/sec
Jun 3 10:02:39 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 495 to 250 packets/sec
Jun 3 10:02:41 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 439 to 250 packets/sec
Jun 3 10:02:43 tmm tmm[706]: 011e0001:4: Limiting icmp ping
response from 401 to 250 packets/sec
......
可以看出,由于 F5 LTM 默认每秒钟只处理 250 个 ICMP 包,超过的 ICMP
包将被丢弃。
6) 修改这个默认值,解决问题:
[root@standby:Active] log # b db | grep Reject ;查看当前值
二. 修改控制 F5 LTM 每秒最多处理多少 ICMP 包的参数
[root@standby:Active] log # b db TM.MaxRejectRate 1000 ;修改
[root@standby:Active] log # b db | grep Reject ;查看修改是否生效
7) 查看 /config/BigDB.conf 文件,确认其 TM.MaxRejectRate 值已经修改为 1000 了。
三. 验证问题是否确实已经解决
让客户管理员再次从交换机 ping F5 LTM 的 虚拟服务器 IP,问题解决了。
四. 相关 Linux 命令介绍
[align=left]8) 几个 Linux 命令介绍:
tcpdump -i <指定抓取达到或者通过哪个接口的数据包,一般指定 VLAN 接口> \
host <指定抓取的数据包源地址或者目标地址> \
and <icmp | port <指定抓取数据包的端口号> ; icmp 指定只抓取 ICMP 数据包
cat <希望查看其内容的文件名> ;一下子显示一个文件的内容
less, more <希望查看其内容的文件名> ;逐屏显示一个文件的内容
grep -i <字符串> <文件名> ;显示 文件 里面包含了 字符串 的那些行
; -i 表示忽略大小写
wc -l <希望计算其行数的文件名> ;显示一个文件的行数
[/align]
附件:http://down.51cto.com/data/2350073
相关文章推荐
- RTC 媒体流数据包丢包问题解决
- 单片机串口调试丢包验证过程记录_已解决
- 关于解决应用层提取NDIS驱动数据包丢包的方案,通过event加共享内存实现
- 关于解决应用层提取NDIS驱动数据包丢包的方案,通过event加共享内存实现
- 关于ajax中文乱码的解决过程
- VSRS_3.5使用过程中出现的问题解决
- mysql数据库安装过程中遇见的问题及解决办法
- Android系统中耳机按键键值上报不正确 解决过程
- Linq调用存储过程自动生成Int结果集的解决方法
- “‘javac’不是内部或外部命令,也不是可运行的程序或批处理文件”解决过程
- 调用远程数据库的存储过程出现“ORA-02064不支持分布式操作”错误的解决方法
- SqlParameter设定的value值为0时、调用的存储过程获取到的值却为null解决方法
- 解决在Linux6.1下安装Oracle-11g-R2时的中文乱码问题-(图形安装过程中)
- Windows中ORA-00020的解决过程
- 解决EXCEL导入 SQL 2000过程,列中存在不同格式的问题
- DBImport V3.7版本发布及软件稳定性(自动退出问题)解决过程分享
- cloudsim仿真过程中内存占用过大问题的解决
- robot framework-requests库安装过程问题解决
- 习惯的养成—在解决问题的过程中提炼需要总结地地方(Linux 输入框架问题)
- SQL SERVER 2000 存储过程不支持数组的解决方法!