tensorflow如何自由处理梯度
2016-12-27 16:26
489 查看
本文的由来是因为我想使用一个step function作为我的loss function,但是直接使用会导致gradient不能计算,而之前在看tensorflow相关文档时,发现minimize可看作compute_gradients和apply_gradients二者之和,换言之,我们可以先计算gradients,进行处理后,再apply_gradients.
本来一开始打算自己去实现的,但由于tensorflow刚入门,碰了很多壁,最后在知乎上搜索时搜到分布式Tensorflow的梯度累积与异步更新,看到里面的代码,才弄明白该怎么弄
定义
1
计算全部gradient
2
得到可进行梯度计算的变量
3
得到所需梯度
4
生成holder
5
继续进行BP算法
应用
1
生成结果,计算loss与gradient
2
grads_dict={}
for i in range(len(gradient_result)):
k = grads_holder[i][0] # 取出holder,用于后面的feed_dict
grads_dict[k] = DealTheGradientFunction(gradient_result[i][0]) # 自由处理梯度
3
继续更新权值
本来一开始打算自己去实现的,但由于tensorflow刚入门,碰了很多壁,最后在知乎上搜索时搜到分布式Tensorflow的梯度累积与异步更新,看到里面的代码,才弄明白该怎么弄
定义
1
gradient_all = optimizer.compute_gradients(loss)
计算全部gradient
2
grads_vars = [v for (g,v) in gradient_all if g is not None]
得到可进行梯度计算的变量
3
gradient = optimizer.compute_gradients(loss, grads_vars)
得到所需梯度
4
grads_holder = [(tf.placeholder(tf.float32, shape=g.get_shape()), v) for (g,v) in gradient]
生成holder
5
train_op = optimizer.apply_gradients(grads_holder)
继续进行BP算法
应用
1
gradient_result = sess.run(gradient, feed_dict={x:x_i,y_:y_real})
生成结果,计算loss与gradient
2
grads_dict={}
for i in range(len(gradient_result)):
k = grads_holder[i][0] # 取出holder,用于后面的feed_dict
grads_dict[k] = DealTheGradientFunction(gradient_result[i][0]) # 自由处理梯度
3
_ = sess.run(train_op,feed_dict=grads_dict)
继续更新权值
相关文章推荐
- tensorflow中optimizer如何实现神经网络的权重,偏移等系数的更新和梯度计算
- 如何用TensorFlow图像处理函数裁剪图像?
- 图像处理中的梯度、导数如何求?(Robert算子,Sobel算子,Prewitt算子,Laplace算子)
- 如何在tensorflow程序中对梯度进行反转
- 如何用TensorFlow图像处理函数裁剪图像?
- 图像处理中的梯度、导数如何求?(Robert算子,Sobel算子,Prewitt算子,Laplace算子)
- 你是如何处理“对非共享成员的引用要求对象引用”这个问题的?
- 如何处理一个站点不同Web应用通用Session
- 如何用JSP处理Oracle中CLOB类型的字段
- 用户控件中使用了Javascript ,把2个控件放在页面上,那么页面上会有2个同名的javascript函数,如何处理
- 如何在Oracle中实现时间相加处理?[原创]
- [原创]复合控件中如何将客户端的处理结果通知服务器端的解决办法
- 小技巧:(javascript)如何让用户自由控制html页面大段文字的行间距和背景颜色
- 如何接受消息,中断正在处理的过程
- 带格式的文本串,如何使用BCP导入数据库, 单引号‘’如何处理
- 如何处理Oracle数据库中的坏块问题
- Hibernate中如何处理一对多关系中的组合主键
- 团队开发中,如何处理一个站点不同Web应用通用Session (转载)
- 如何在Struts中进行分页处理
- Asp.net中如何处理一个站点不同Web应用通用Session的问题