您的位置:首页 > 其它

【TensorFlow】tf.nn.max_pool实现池化操作

2017-07-26 09:49 489 查看
转自:http://blog.csdn.net/mao_xiao_feng/article/details/53453926

max pooling是CNN当中的最大值池化操作,其实用法和卷积很类似

有些地方可以从卷积去参考【TensorFlow】tf.nn.conv2d是怎样实现卷积的?

tf.nn.max_pool(value, ksize, strides, padding, name=None)

参数是四个,和卷积很类似:

第一个参数value:需要池化的输入,一般池化层接在卷积层后面,所以输入通常是feature map,依然是
[batch, height, width, channels]这样的shape


第二个参数ksize:池化窗口的大小,取一个四维向量,一般是
[1, height, width, 1],因为我们不想在
batch和channels
上做池化,所以这两个维度设为了1


第三个参数strides:和卷积类似,窗口在每一个维度上滑动的步长,一般也是
[1, stride,
stride
, 1]


第四个参数padding:和卷积类似,可以取’VALID’ 或者’SAME’

返回一个Tensor,类型不变,shape仍然是
[batch, height, width, channels]
这种形式

示例源码:

假设有这样一张图,双通道

第一个通道:



第二个通道:



用程序去做最大值池化:

[python] view plain copy print?import tensorflow as tf

a=tf.constant([
[[1.0,2.0,3.0,4.0],
[5.0,6.0,7.0,8.0],
[8.0,7.0,6.0,5.0],
[4.0,3.0,2.0,1.0]],
[[4.0,3.0,2.0,1.0],
[8.0,7.0,6.0,5.0],
[1.0,2.0,3.0,4.0],
[5.0,6.0,7.0,8.0]]
])

a=tf.reshape(a,[1,4,4,2])

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding=‘VALID’)
with tf.Session() as sess:
print(“image:”)
image=sess.run(a)
print (image)
print(“reslut:”)
result=sess.run(pooling)
print (result)
import tensorflow as tf

a=tf.constant([
[[1.0,2.0,3.0,4.0],
[5.0,6.0,7.0,8.0],
[8.0,7.0,6.0,5.0],
[4.0,3.0,2.0,1.0]],
[[4.0,3.0,2.0,1.0],
[8.0,7.0,6.0,5.0],
[1.0,2.0,3.0,4.0],
[5.0,6.0,7.0,8.0]]
])

a=tf.reshape(a,[1,4,4,2])

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding='VALID')
with tf.Session() as sess:
print("image:")
image=sess.run(a)
print (image)
print("reslut:")
result=sess.run(pooling)
print (result)
这里步长为1,窗口大小2×2,输出结果:

[python] view plain copy print?image: [[[[ 1. 2.] [ 3. 4.] [ 5. 6.] [ 7. 8.]] [[ 8. 7.] [ 6. 5.] [ 4. 3.] [ 2. 1.]] [[ 4. 3.] [ 2. 1.] [ 8. 7.] [ 6. 5.]] [[ 1. 2.] [ 3. 4.] [ 5. 6.] [ 7. 8.]]]] reslut: [[[[ 8. 7.] [ 6. 6.] [ 7. 8.]] [[ 8. 7.] [ 8. 7.] [ 8. 7.]] [[ 4. 4.] [ 8. 7.] [ 8. 8.]]]]
image:
[[[[ 1.  2.]
[ 3.  4.]
[ 5.  6.]
[ 7.  8.]]

[[ 8.  7.]
[ 6.  5.]
[ 4.  3.]
[ 2.  1.]]

[[ 4.  3.]
[ 2.  1.]
[ 8.  7.]
[ 6.  5.]]

[[ 1.  2.]
[ 3.  4.]
[ 5.  6.]
[ 7.  8.]]]]
reslut:
[[[[ 8.  7.]
[ 6.  6.]
[ 7.  8.]]

[[ 8.  7.]
[ 8.  7.]
[ 8.  7.]]

[[ 4.  4.]
[ 8.  7.]
[ 8.  8.]]]]
池化后的图就是:





证明了程序的结果是正确的。

我们还可以改变步长

[python] view plain copy print?pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding=‘VALID’)
pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding='VALID')
最后的result就变成:

[python] view plain copy print?reslut: [[[[ 8. 7.] [ 7. 8.]] [[ 4. 4.] [ 8. 8.]]]]
reslut:
[[[[ 8.  7.]
[ 7.  8.]]

[[ 4.  4.]
[ 8.  8.]]]]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: