您的位置:首页 > 职场人生

深度学习常见面试题 | 批归一化(BN)层的作用及原理

2020-07-14 05:41 1496 查看

作用

1.解决反向传播时的梯度爆炸/消失
2.可以使用较大的学习率
3.缓解过拟合,可以去掉dropout和L2正则化等其他降低训练速度的trick

原理

1.将样本规范化至0均值,1方差

μB=1m∑i=1Nxiμ_B=\frac 1 m\sum_{i=1}^N{x_i}μB​=m1​∑i=1N​xi​

2.使每一层激活函数的输入在各维度上有相似的分布

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: