学习笔记5 Supervised Convolutional Neural Network 之 Stochastic Gradient Descent
2016-02-16 00:06
218 查看
一、随机梯度下降
对比于批量梯度下降,随机梯度下降能够节省更多的时间,而且优化的整体趋势也是向着收敛的方向进行的。具体的优点,特点还有待进一步研究学习,这里先跳过。
随机梯度下降也有很多种方法。这里只介绍一种。
一般来说,学习速率是固定不变的,也就是是个常数。
但是,往往随着迭代的进行,学习速率需要改变。
这里增加了一个动量项momentum γ\gamma,还有velocity。
我们选择mini-batch的随机梯度方法,每一次用 mini-batch 数量的样本来训练,在这里还要注意一点,我们一般需要将样本进行打乱,也就是随机抽取。
接下来,首先设置epoch(时代),随着epoch的增加,α\alpha变小,比如,每增加一个epoch, α\alpha缩小一倍。而γ\gamma一般初始化为0.5,随着迭代增加而改变,比如,当迭代次数达到20次的时候变为0.9.
对比于批量梯度下降,随机梯度下降能够节省更多的时间,而且优化的整体趋势也是向着收敛的方向进行的。具体的优点,特点还有待进一步研究学习,这里先跳过。
随机梯度下降也有很多种方法。这里只介绍一种。
一般来说,学习速率是固定不变的,也就是是个常数。
但是,往往随着迭代的进行,学习速率需要改变。
这里增加了一个动量项momentum γ\gamma,还有velocity。
我们选择mini-batch的随机梯度方法,每一次用 mini-batch 数量的样本来训练,在这里还要注意一点,我们一般需要将样本进行打乱,也就是随机抽取。
接下来,首先设置epoch(时代),随着epoch的增加,α\alpha变小,比如,每增加一个epoch, α\alpha缩小一倍。而γ\gamma一般初始化为0.5,随着迭代增加而改变,比如,当迭代次数达到20次的时候变为0.9.
相关文章推荐
- 1644 免费馅饼 题解(c++)
- 选择Nvidia显卡还是ATI显卡
- 微信公众号入门笔记(四)velocity生成xml中文转义问题
- 深入解读Python解析XML的几种方式
- bpython 功能强大的Python shell
- 十条建议帮你提高Python编程效率
- 轻松实现python搭建微信公众平台
- python实现红包裂变算法
- Python实现快速排序和插入排序算法及自定义排序的示例
- Redis学习笔记(4) Redis事务、生存时间及排序
- Hard题目总结
- Python的GUI框架PySide的安装配置教程
- 使用PHP处理数据库数据如何将数据返回客户端并显示当前状态
- PHP模拟post提交数据方法汇总
- thinkphp3.2点击刷新生成验证码
- HTML中嵌入PHP的简单方法
- 46 个非常有用的 PHP 代码片段
- PHP邮件群发机实现代码
- SQL Server中NULL的正确使用与空间占用
- 实例理解SQL中truncate和delete的区别