您的位置:首页 > Web前端

Convolutional Channel Features 论文阅读

2018-03-21 18:26 225 查看
2015年ICCV的论文
Github:https://github.com/byangderek/CCF
paper:https://arxiv.org/abs/1504.07339

一、Abstract

        论文认为深度学习网络结构的复杂性,以及对计算资源的耗费阻碍了实际算法的实际应用,提出将filtered channel feature与CNN网络进行组合,形成一种新的算法结构——CCF。论文说,相比较channel feature而言,从CNN网络学习到的特征在表达层面上更加的丰富,所以将CNN提取的特征传入boost forest进行处理。经过论文的实验证明了,这种结合方式对不同中的视觉任务具有很好的泛化性能,不需要像其他CNN网络一样对不同视觉任务进行fine-tuning,而且耗费相对更少的计算与存储资源,。
        这种方法还是沿用了传统人工设计特征卷积核的传统思路,通过人工设计特征卷积核,采用SVM,BOOST等机器学习算法进行分类等处理。

二、INTRODUCTION && RELATED WORK


                在深层卷积神经网络被广泛用于处理视觉任务之前,CV领域的常见思路是通过人工设计卷积核来提取特征,像Viola-Jones通过 hand-craft channel feature 与boosting algorithm结合的算法就曾广泛用于人脸检测。在那几年中,研究者都是通过这思路进行CV处理,这类传统算法的瓶颈在于hand-craft feature 的表达局限性;而深度卷积网络的局限性则在于计算与存储的大量需求。提出CCF算法的出发点就是在保证算法performance的前提下,平衡这两种局限。

三、PROPOSED METHOD

1、selection of feature representation

           论文选择了几种常用的CNN网络(AlexNet, VGG, GoogLeNet)进行比较,采用Caltech pedestian benchmark数据(其中set00-04作为训练集,set05作为测试集,以20帧作为采样间隔采样),传统的channel feature选用ACF(Aggregate Channel Feature)和LDCF(Locally Decorrelate Channel Feature)用作比较,训练中采用了hard negative mining strategy。(注意:论文中的行人检测仅采用高于50pixels的数据)
            论文说large model 要outperform small model,而且train dataset 更large会更好,所以在选择extract net的时要选择更large的。经过不同网络的对比实现发现:

            a. 采用大尺度的filter网络在chnnel feature framework中表现不好。这可能是因为大尺度的filter lose focus on local cues。

           b. 对不同vision task, the best choice in each entry is similar, i.e., around the convolutional layer whose accumulated pooling factor is 4 or 8.

2、acceleration in feature pyramid computation

            
             基于尺度满足幂指规律的性质,论文提出了两方面的加速思想:
                a. 如果特征图的表达不稀疏,那么它在多尺度上保持着很好的幂指特性,这个特性我觉得就是SIFT的多尺度金字塔思想,将input image的尺度放缩放在特征图上处理大大的加速了computation与storrage。

                b. 采用Patchwork思想,将多尺度输入图像拼接成一张大图,进行网络的特征提取。



    
                        
    
                                    
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐