Pytorch训练过程出现nan的解决方式
2020-02-13 10:06
1126 查看
今天使用shuffleNetV2+,使用自己的数据集,遇到了loss是nan的情况,而且top1精确率出现断崖式上升,这显示是不正常的。
在网上查了下解决方案。我的问题是出在学习率上了。
我自己做的样本数据集比较小,就三类,每类大概三百多张,初始学习率是0.5。后来设置为0.1就解决了。
按照解决方案上写的。出现nan的情况还有以下几种:
学习率太大,但是样本数据集又很小。(我的情况)
自定义的loss除以了一个很小的数字,小到接近0。
数据不干净,数据本身就有nan,可以用numpy.isnan检查。
target,即label是大于等于0的。从1到类别数目-1变化。
以上这篇Pytorch训练过程出现nan的解决方式就是小编分享给大家的全部内容了,希望能给大家一个参考
您可能感兴趣的文章:
相关文章推荐
- faster rcnn训练过程出现loss=nan解决办法
- HTK训练过程中出现的问题及解决方法
- CVS团队合作提交过程中出现乱码问题的解决方式
- tensorflow训练中出现nan问题的解决
- pytorch 安装过程出现: No module named 'tools.nnwrap'解决方法
- Extjs显示时间兼容性问题——firefox正常显示,IE不正常出现NaN-NaN-NaN的解决方式
- MySQL安装过程中出现“APPLY security settings错误”的解决方式
- Extjs显示时间兼容性问题——firefox正常显示,IE不正常出现NaN-NaN-NaN的解决方式
- Yolo v2 训练 NAN解决过程
- 使用autotools工具制作Makefile过程可能出现问题与解决方式
- Deep Learning 之 训练过程中出现NaN问题
- ExtJs中处理时间,出现NaN-NaN-NaN的解决方式
- ExtJs中处理时间,出现NaN-NaN-NaN的解决方式
- ExtJs中处理时间,出现NaN-NaN-NaN的解决方式
- mac上svn出现SSL错误的解决方式
- listview或recyclerView嵌套edittext出现复用问题的解决方式
- JavaEE 工程中加入Hibernate支持后,发布过程中出现严重错误的解决方法。
- Loadrunner | 录制脚本时出现乱码的解决方式
- C#编程UDP通信过程中出现【远程主机强迫关闭了一个现有的连接0x80004005】的解决方法
- win7使用过程中在回收站上出现的常见问题及解决方法汇总