您的位置：首页 > Web前端

Convolutional Channel Features 论文阅读

2018-03-21 18:26 225 查看

2015年ICCV的论文
Github:https://github.com/byangderek/CCF
paper:https://arxiv.org/abs/1504.07339

一、Abstract

论文认为深度学习网络结构的复杂性，以及对计算资源的耗费阻碍了实际算法的实际应用，提出将filtered channel feature与CNN网络进行组合，形成一种新的算法结构——CCF。论文说，相比较channel feature而言，从CNN网络学习到的特征在表达层面上更加的丰富，所以将CNN提取的特征传入boost forest进行处理。经过论文的实验证明了，这种结合方式对不同中的视觉任务具有很好的泛化性能，不需要像其他CNN网络一样对不同视觉任务进行fine-tuning，而且耗费相对更少的计算与存储资源,。
这种方法还是沿用了传统人工设计特征卷积核的传统思路，通过人工设计特征卷积核，采用SVM,BOOST等机器学习算法进行分类等处理。

二、INTRODUCTION && RELATED WORK

在深层卷积神经网络被广泛用于处理视觉任务之前，CV领域的常见思路是通过人工设计卷积核来提取特征，像Viola-Jones通过 hand-craft channel feature 与boosting algorithm结合的算法就曾广泛用于人脸检测。在那几年中，研究者都是通过这思路进行CV处理，这类传统算法的瓶颈在于hand-craft feature 的表达局限性；而深度卷积网络的局限性则在于计算与存储的大量需求。提出CCF算法的出发点就是在保证算法performance的前提下，平衡这两种局限。

三、PROPOSED METHOD

1、selection of feature representation

          论文选择了几种常用的CNN网络（AlexNet, VGG, GoogLeNet）进行比较，采用Caltech pedestian benchmark数据（其中set00-04作为训练集，set05作为测试集，以20帧作为采样间隔采样），传统的channel feature选用ACF(Aggregate Channel Feature)和LDCF（Locally Decorrelate Channel Feature）用作比较，训练中采用了hard negative mining strategy。（注意：论文中的行人检测仅采用高于50pixels的数据）
          论文说large model 要outperform small model，而且train dataset 更large会更好，所以在选择extract net的时要选择更large的。经过不同网络的对比实现发现：

          a. 采用大尺度的filter网络在chnnel feature framework中表现不好。这可能是因为大尺度的filter lose focus on local cues。

          b. 对不同vision task， the best choice in each entry is similar, i.e., around the convolutional layer whose accumulated pooling factor is 4 or 8.

2、acceleration in feature pyramid computation

           基于尺度满足幂指规律的性质，论文提出了两方面的加速思想：
              a. 如果特征图的表达不稀疏，那么它在多尺度上保持着很好的幂指特性，这个特性我觉得就是SIFT的多尺度金字塔思想，将input image的尺度放缩放在特征图上处理大大的加速了computation与storrage。

              b. 采用Patchwork思想，将多尺度输入图像拼接成一张大图，进行网络的特征提取。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航