您的位置：首页 > 其它

tf.nn.conv2d与tf.nn.max_pool介绍

2018-03-31 13:48 555 查看

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)介绍参数：input：指卷积需要输入的参数，具有这样的shape[batch, in_height, in_width, in_channels]，分别是[batch张图片, 每张图片高度为in_height, 每张图片宽度为in_width, 图像通道为in_channels]。filter：指用来做卷积的滤波器，当然滤波器也需要有相应参数，滤波器的shape为[filter_height, filter_width, in_channels, out_channels]，分别对应[滤波器高度, 滤波器宽度, 接受图像的通道数, 卷积后通道数]，其中第三个参数 in_channels需要与input中的第四个参数 in_channels一致，out_channels第一看的话有些不好理解，如rgb输入三通道图，我们的滤波器的out_channels设为1的话，就是三通道对应值相加，最后输出一个卷积核。strides:代表步长，其值可以直接默认一个数，也可以是一个四维数如[1,2,1,1]，则其意思是水平方向卷积步长为第二个参数2，垂直方向步长为1.其中第一和第四个参数我还不是很明白，请大佬指点，貌似和通道有关系。padding：代表填充方式，参数只有两种，SAME和VALID，SAME比VALID的填充方式多了一列，比如一个3*3图像用2*2的滤波器进行卷积，当步长设为2的时候，会缺少一列，则进行第二次卷积的时候，VALID发现余下的窗口不足2*2会直接把第三列去掉，SAME则会填充一列，填充值为0。use_cudnn_on_gpu：bool类型，是否使用cudnn加速，默认为true。大概意思是是否使用gpu加速，还没搞太懂。name：给返回的tensor命名。给输出feature map起名字。

tf.nn.max_pool(value, ksize, strides, padding, name=None)

value：池化的输入，一般池化层接在卷积层的后面，所以输出通常为feature map。feature map依旧是[batch, in_height, in_width, in_channels]这样的参数。ksize：池化窗口的大小，参数为四维向量，通常取[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1。ps：估计面tf.nn.conv2d中stries的四个取值也有相同的意思。stries：步长，同样是一个四维向量。padding：填充方式同样只有两种不重复了。

Padding：SAME和VALID详释

转载▼

分类：神经网络

（感谢原文：http://blog.csdn.net/jasonzzj/article/details/53930074） 定义： Padding在卷积(convolution)和池化(pooling)中都会被用到。在tensorflow比如tf.nn.conv2d，tf.nn.max_pool都有这参数 Valid: 用过滤器在输入的矩阵中按步长移动时候，会把最后的不足部分的列和行抛弃；Same: 先在输入矩阵上下各加个值为0的行，在左右各加个个值为0的列，也就是用0把原先的矩阵包裹一层，然后在移动的时候如果输入矩阵的列或者行长度不够，就用0来补齐
例子看例子比较实际：
以一维向量做例子输入(input)长度：13 过滤器(Filter)长度：6 步长(Stride)长度：5

"VALID"

= 不会增加padding: inputs: 1 2 3 4 5 6 7 8 9 10 11 (12 13) |_____________| (抛弃不要) |______________|

"SAME"

= 会用0来做padding (如果步长是1的话，最终输出和输入一样大小): pad| |Pad inputs: 0| 1 2 3 4 5 6 7 8 9 10 11 12 13 |0 0 |_____________| |______________| |_______________|Notes:

"VALID"

会但只会抛弃最右边的列或者是最下面的行.

"SAME"

水平方向首先会在左右各加一个零，如果最后不够的话，会在右边再加零补齐，以满足最后一次完整的移动。对于垂直方向也是同理。
最终输出的行列数计算方法out_height=(in_height-filter_height+padding)/stride+1padding是加0的个数。一般图像是加一圈0.同理可得out_weight

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： conv2d与max_pool

相关文章推荐

新的分享

章节导航