您的位置：首页 > 其它

tensorflow如何自由处理梯度

2016-12-27 16:26 489 查看

本文的由来是因为我想使用一个step function作为我的loss function,但是直接使用会导致gradient不能计算，而之前在看tensorflow相关文档时，发现minimize可看作compute_gradients和apply_gradients二者之和，换言之，我们可以先计算gradients，进行处理后，再apply_gradients.

本来一开始打算自己去实现的，但由于tensorflow刚入门，碰了很多壁，最后在知乎上搜索时搜到分布式Tensorflow的梯度累积与异步更新，看到里面的代码，才弄明白该怎么弄

定义

1

gradient_all = optimizer.compute_gradients(loss)

计算全部gradient

2

grads_vars = [v for (g,v) in gradient_all if g is not None]

得到可进行梯度计算的变量

3

gradient = optimizer.compute_gradients(loss, grads_vars)

得到所需梯度

4

grads_holder = [(tf.placeholder(tf.float32, shape=g.get_shape()), v) for (g,v) in gradient]

生成holder

5

train_op = optimizer.apply_gradients(grads_holder)

继续进行BP算法

应用

1

gradient_result = sess.run(gradient, feed_dict={x:x_i,y_:y_real})

生成结果，计算loss与gradient

2

grads_dict={}

for i in range(len(gradient_result)):

k = grads_holder[i][0] # 取出holder，用于后面的feed_dict

grads_dict[k] = DealTheGradientFunction(gradient_result[i][0]) # 自由处理梯度

3

_ = sess.run(train_op,feed_dict=grads_dict)

继续更新权值

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： tensorflow gradient 梯度

相关文章推荐

新的分享

章节导航