调试神经网络过程中遇到的问题
2019-06-29 09:01
976 查看
在这里简单记录一下自己在调试过程中遇到bug:
1、可能会遇到不知名的错误,大概就是139电脑内存不足的问题,但是我网络输入比较下,按理说此问题不存在的,后来换到服务器就好了
2、另一个就是cuda的问题,需要用的变量都都应该转移到cuda上面,并且与网络是同步的,神经网络中定义的参数也应该单独的转移到GPU上面,因为net.to(device)好像并不会将网络中定义的变量转移到上面。
3、最让头疼的是这个问题:RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed. Specify retain_graph=True when calling backward the first time.
此时问题出现的情况有多种,一定要仔细检查下自己的网络结构的逻辑,出现的根本原因是:在第一次计算完损失之后,第一个生成的计算图并没有完全的消失(或者说生成的计算变量),导致在第二次backward的时候找到第一次的变量进行梯度计算,但是第一次的计算图已经不在完整了。
4、最后,对于required_grad=True的叶子tensor不能使用in-place操作,此操作直接在原来的内存上改变它的值。
对于求解梯度需要用的tensor也不能用in-place,因为求解梯度的过程中,用的tensor是不应该改变的。
相关文章推荐
- C#与Java通过protobuf进行网络通信过程中遇到的问题
- mysql调试源码过程中遇到的调试问题
- 机会网络平台haggle在Ubuntu下的运行环境配置过程遇到问题的解决方案
- 使用Android Studio调试UiAutomator过程中遇到的问题
- Web开发基础--WebService调试过程中遇到的几个问题
- 代码调试过程中容易遇到的问题
- 调试STM32过程中遇到的问题总结(持续更新)--KEIL4+C语言
- 调试MOST SSO中遇到的问题的解决过程
- DM642调试过程遇到的问题
- 对调用了TypeMock.net的代码进行调试遇到的怪问题--在vs.net中启动resharper自带的unit test的过程和方式是什么样的?
- QT+opencv+摄像头调试过程中遇到的问题
- 做网络爬虫过程过程中遇到的问题
- show and tell 代码调试过程遇到的问题及解决
- MyEclipse调试过程中遇到一个奇怪的问题
- 搭建spark cluster过程中遇到的网络问题
- 个人在iOS开发过程中真机调试遇到的问题及解决方法
- dwz问题(本文主要是供个人学习成长之用,陈述的是本人在开发过程中遇到的几个小问题的总结,可能兼或插入一些网络资料)
- 我调试mini2440 qq2440 过程中遇到的问题和解决方法
- 搭建复数神经网络遇到的问题【求交流】
- 复制虚拟机vmware centos搭建集群节点过程中网络配置eth0和eth1遇到的问题以及NAT模式下虚拟机静态IP配置方法