Convolutional Channel Features 论文阅读
2018-03-21 18:26
225 查看
2015年ICCV的论文
Github:https://github.com/byangderek/CCF
paper:https://arxiv.org/abs/1504.07339
这种方法还是沿用了传统人工设计特征卷积核的传统思路,通过人工设计特征卷积核,采用SVM,BOOST等机器学习算法进行分类等处理。
在深层卷积神经网络被广泛用于处理视觉任务之前,CV领域的常见思路是通过人工设计卷积核来提取特征,像Viola-Jones通过 hand-craft channel feature 与boosting algorithm结合的算法就曾广泛用于人脸检测。在那几年中,研究者都是通过这思路进行CV处理,这类传统算法的瓶颈在于hand-craft feature 的表达局限性;而深度卷积网络的局限性则在于计算与存储的大量需求。提出CCF算法的出发点就是在保证算法performance的前提下,平衡这两种局限。
论文说large model 要outperform small model,而且train dataset 更large会更好,所以在选择extract net的时要选择更large的。经过不同网络的对比实现发现:
a. 采用大尺度的filter网络在chnnel feature framework中表现不好。这可能是因为大尺度的filter lose focus on local cues。
b. 对不同vision task, the best choice in each entry is similar, i.e., around the convolutional layer whose accumulated pooling factor is 4 or 8.
基于尺度满足幂指规律的性质,论文提出了两方面的加速思想:
a. 如果特征图的表达不稀疏,那么它在多尺度上保持着很好的幂指特性,这个特性我觉得就是SIFT的多尺度金字塔思想,将input image的尺度放缩放在特征图上处理大大的加速了computation与storrage。
b. 采用Patchwork思想,将多尺度输入图像拼接成一张大图,进行网络的特征提取。
Github:https://github.com/byangderek/CCF
paper:https://arxiv.org/abs/1504.07339
一、Abstract
论文认为深度学习网络结构的复杂性,以及对计算资源的耗费阻碍了实际算法的实际应用,提出将filtered channel feature与CNN网络进行组合,形成一种新的算法结构——CCF。论文说,相比较channel feature而言,从CNN网络学习到的特征在表达层面上更加的丰富,所以将CNN提取的特征传入boost forest进行处理。经过论文的实验证明了,这种结合方式对不同中的视觉任务具有很好的泛化性能,不需要像其他CNN网络一样对不同视觉任务进行fine-tuning,而且耗费相对更少的计算与存储资源,。这种方法还是沿用了传统人工设计特征卷积核的传统思路,通过人工设计特征卷积核,采用SVM,BOOST等机器学习算法进行分类等处理。
二、INTRODUCTION && RELATED WORK
三、PROPOSED METHOD
1、selection of feature representation
论文选择了几种常用的CNN网络(AlexNet, VGG, GoogLeNet)进行比较,采用Caltech pedestian benchmark数据(其中set00-04作为训练集,set05作为测试集,以20帧作为采样间隔采样),传统的channel feature选用ACF(Aggregate Channel Feature)和LDCF(Locally Decorrelate Channel Feature)用作比较,训练中采用了hard negative mining strategy。(注意:论文中的行人检测仅采用高于50pixels的数据)论文说large model 要outperform small model,而且train dataset 更large会更好,所以在选择extract net的时要选择更large的。经过不同网络的对比实现发现:
a. 采用大尺度的filter网络在chnnel feature framework中表现不好。这可能是因为大尺度的filter lose focus on local cues。
b. 对不同vision task, the best choice in each entry is similar, i.e., around the convolutional layer whose accumulated pooling factor is 4 or 8.
2、acceleration in feature pyramid computation
基于尺度满足幂指规律的性质,论文提出了两方面的加速思想:
a. 如果特征图的表达不稀疏,那么它在多尺度上保持着很好的幂指特性,这个特性我觉得就是SIFT的多尺度金字塔思想,将input image的尺度放缩放在特征图上处理大大的加速了computation与storrage。
b. 采用Patchwork思想,将多尺度输入图像拼接成一张大图,进行网络的特征提取。
相关文章推荐
- 论文阅读:Multi-scale orderless pooling of deep convolutional activation features
- Richer Convolutional Features for Edge Detection 论文阅读
- 论文阅读:《Visual Tracking with Fully Convolutional Networks》ICCV 2015
- 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation
- 论文阅读理解 - Fully Convolutional Instance-aware Semantic Segmentation
- 论文阅读笔记:U-Net: Convolutional Networks for Biomedical Image Segmentation
- 论文阅读笔记:VGG:Very Deep Convolutional Networks
- Hierarchical Convolutional Features for Visual Tracking(CF2)论文翻译
- VGG-16、VGG-19(论文阅读《Very Deep Convolutional NetWorks for Large-Scale Image Recognition》)
- 论文阅读:Reading Text in the Wild with Convolutional Neural Networks
- 论文阅读-《Object Detection Networks on Convolutional Feature Maps》
- 论文阅读“Face Alignment at 3000 FPS via Regressing Local Binary Features”
- 论文阅读笔记-Segmentation-Aware Convolutional Networks Using Local Attention Masks
- 论文阅读-《Deformable Part-based Fully Convolutional Network for Object Detection》
- 论文阅读:Fully Convolutional Instance-aware Semantic Segmentation
- 行人检测论文 Integral Channel Features(上)
- 论文阅读笔记《leaning spatiotemporal features with 3D convolutional network》
- 论文阅读: ECCV2016 Chained Predictions Using Convolutional Neural Networks
- [论文阅读笔记]U-Net: Convolutional Networks for Biomedical Image Segmentation
- 论文阅读《Edge Detection Using Convolutional Neural Network》