《神经网络设计》读书笔记——性能优化(三)
2017-07-18 11:22
197 查看
牛顿法
最速下降算法的导数是以一阶泰勒级数展开式为基础的而牛顿法基于二阶泰勒级数展开式:
F(xk+1)=F(xk+Δxk)≈F(xk)+gTkΔxk+12ΔxTkAkxk
原理
求F(x)的二次近似的驻点,求这个二次函数对Δxk的梯度并设它为0,则有:gk+AkΔxk=0
求解Δxk可得
Δxk=−A−1kgk
牛顿法可以定义为
Δxk+1=Δxk−A−1kgk
特点
牛顿法是用一个二次函数逼近F(x),然后求其驻点。如果原函数为二次函数,且有强极小点,他就能够实现一步极小化。
如果原函数不是二次函数,无法一步极小化,甚至无法确定是否收敛
总结
牛顿法的收敛速度通常比最速下降法更快牛顿法可能会收敛到鞍点(局部极小点)
牛顿法可能会震荡和发散
相关文章推荐
- 《神经网络设计》读书笔记——性能优化(二)
- 《神经网络设计》读书笔记——性能优化(四)
- 《神经网络设计》读书笔记——性能优化(一)
- 《Android开发艺术探索》读书笔记 (15) Android性能优化
- Java程序性能优化 读书笔记(八)优化组件:缓冲和缓存
- 读书笔记之Java程序性能优化
- Java程序性能优化 读书笔记(六)设计模式:观察者模式
- 前端性能优化---读书笔记
- Java程序性能优化 读书笔记(九)优化组件:池
- Java程序性能优化 读书笔记(十五)String类的优化
- 《Android群英传》读书笔记(11)第十章:Android性能优化
- Java程序性能优化 读书笔记(十六)集合访问优化
- 【Java程序性能优化】-读书笔记第3章
- 我的Android读书笔记——(4)Android性能优化
- 《Android开发艺术探索》读书笔记--Android性能优化
- Java程序性能优化 读书笔记(十)并行设计模式:Future模式
- Java程序性能优化 读书笔记(十四)并行设计模式:生产者-消费者模式
- Java性能优化权威指南-读书笔记(五)-JVM性能调优-吞吐量
- java 性能优化读书笔记
- Java程序性能优化 读书笔记(二)设计模式:单例模式