socket句柄泄漏问题的定位: losf和strace的联合使用!
2017-02-25 20:06
1566 查看
最近遇到一个socket句柄泄漏的问题, 我们来简要说说如何定位:
1. 确定哪个进程在泄漏, 可以用命令 lsof -n|awk '{print $2}'| sort | uniq -c | sort -nr | head ,这个命令找的是打开句柄数目最多的进程, 多敲入几次, 就知道是那个进程在增长了。 而且累积到一定阶段, 泄漏的进程打开的句柄数会增长。 此步骤可以找到泄漏的进程号xxx
2. 利用ps -aux | grep xxx 可以确认是那个进程。
3. 反复敲入 ll /proc/xxx/fd确认进程的打开句柄数在增长。
4. 如果这个服务有多个进程, 建议先调节成一个(便于集中分析), 然后用strace -p xxx查看系统调用信息, 然后找到该close但没有close的地方, 很好找的。
5. 从strace信息中找到网络对端的ip和port, 确认对端服务是干啥的, 然后就知道自己这端对应的代码在哪里了, 圈定了范围, review代码就简单了。
搞定! 如果要看类似分析, 请参考之前的文章: http://blog.csdn.net/stpeace/article/details/51809584 《聊聊进程异常重启的问题------顺便详解linux句柄泄漏问题的定位(知识点: lsof -p xxx; ll /proc/xxx/fd)》
1. 确定哪个进程在泄漏, 可以用命令 lsof -n|awk '{print $2}'| sort | uniq -c | sort -nr | head ,这个命令找的是打开句柄数目最多的进程, 多敲入几次, 就知道是那个进程在增长了。 而且累积到一定阶段, 泄漏的进程打开的句柄数会增长。 此步骤可以找到泄漏的进程号xxx
2. 利用ps -aux | grep xxx 可以确认是那个进程。
3. 反复敲入 ll /proc/xxx/fd确认进程的打开句柄数在增长。
4. 如果这个服务有多个进程, 建议先调节成一个(便于集中分析), 然后用strace -p xxx查看系统调用信息, 然后找到该close但没有close的地方, 很好找的。
5. 从strace信息中找到网络对端的ip和port, 确认对端服务是干啥的, 然后就知道自己这端对应的代码在哪里了, 圈定了范围, review代码就简单了。
搞定! 如果要看类似分析, 请参考之前的文章: http://blog.csdn.net/stpeace/article/details/51809584 《聊聊进程异常重启的问题------顺便详解linux句柄泄漏问题的定位(知识点: lsof -p xxx; ll /proc/xxx/fd)》
相关文章推荐
- 聊聊进程异常重启的问题------顺便详解linux句柄泄漏问题的定位(知识点: lsof -p xxx; ll /proc/xxx/fd)
- system调用导致子进程socket句柄泄漏问题分析
- losf 和strace 句柄泄漏
- cocos2d-x 中使用加减定位后的注意问题
- 使用Java与Flex建立Socket连接(已解决沙箱问题)
- AS3使用SOCKET遇到的安全沙箱问题
- AS3使用SOCKET遇到的安全沙箱问题
- 使用 Eclipse Memory Analyzer 检测内存泄漏问题
- Eclipse 和Jboss联合使用问题汇总
- android 使用socket与pc传递对象的问题
- Mina使用AMF3与Flash Socket通信的"粘包"问题
- 由句柄所调用的 NtClose 已使用 NtSetInformationObject 以防止关闭 问题解决
- 使用upd socket(SOCK_DGRAM)的时候,recvform超时的问题
- C#客户端与Java程序使用socket连接并通信的兼容问题
- 使用UIView实现suckEffect定位问题
- android2.2中默认浏览器无法使用手势放大缩小页面的问题定位
- 今天使用vs2005时候,发现了这个问题“无法附加。绑定句柄无效”。参考下面的图片
- delphi 中使用socket和多线程时和输入法切换冲突的怪异问题
- 使用truss、strace或ltrace诊断软件问题
- 由句柄所调用的 NtClose 已使用 NtSetInformationObject 以防止关闭 问题解决