针对有多层卷积的神经网络不易收敛的措施(持续更新中)
2019-03-11 17:32
190 查看
版权声明:本文为博主原创文章,如需转载请附上博文链接 https://blog.csdn.net/wendygelin/article/details/88399145
1. 卷积层权重初始化的时候,不用默认的constant,都为0,而是用Xavier,msra
[code]weight_filler { type: "msra" }
原因:如果网络中的权重太小,则信号在经过每一层的时候就会抖动(shrinks),直到信号太小了,都没用了。
如果网络中的权重初始值就太大了,信号在经过每一层的时候都会增大,直到太大了以至于没用了。
Xavier 初始化,确保权重大小正合适,让信号在一个合理的大小范围内经过各层。
reference: Xavier Glorot & Yoshua Bengio’s Understanding the difficulty of training deep feedforward neural networks.
https://www.geek-share.com/detail/2690116746.html
2. 绘制learning curve,查看算法是否运行正常,是否有过拟合和欠拟合
绘制learning curve的方法,横轴是训练样本的数量,纵轴是训练集和交叉验证集的error。正常情况下,随着训练样本的增加,训练集的error先上升后平稳,交叉验证集的error先下降后平稳。
如果有欠拟合,则训练集的error很快就上升到一个平台期,随着数据的增大,不再变化。而且随着数据的增大,与交叉验证集的error非常接近;
如果有过拟合,则即使数据量已经很大,交叉验证集和训练集的error都有很大的区别。
相关文章推荐
- 学习笔记CB009:人工神经网络模型、手写数字识别、多层卷积网络、word2vec
- 机器学习语料,深度学习语料,神经网络语料,nlp语料,机器视觉语料,持续更新
- 神经网络(持续更新)
- SSD:Single Shot MultiBox Detector 心得 之神经网路(持续更新中。。。)
- 用cifar10训练一个卷积神经网络
- 网络基础,持续更新
- 网络模型---(用于持续更新)
- 神经网络常见优化措施
- CNN学习笔记(二)卷积神经网络经典结构
- tensorflow1.1/构建深度卷积神经网络识别物体识别
- 6经典卷积神经网络模型之AlexNet-6.1用于ImageNet的AlexNet网络计算图设计
- [UFLDL]多层神经网络
- 深度学习(三十八)卷积神经网络入门学习(2.0)
- 学习笔记TF052:卷积网络,神经网络发展,AlexNet的TensorFlow实现
- 如何利用神经网络做回归问题(全连接以及一维卷积)
- PRML读书会第五章 Neural Networks(神经网络、BP误差后向传播链式求导法则、正则化、卷积网络)
- 网络游戏性能测试五步曲(Link_近期持续更新)
- 多层神经网络(MLP)快速入门
- Tensorlayer学习笔记——多层神经网络
- 神经网络做regression,模型不收敛