您的位置:首页 > 其它

文献阅读笔记——Boosting VLAD with Supervised Dictionary Learning and High-Order Statistics

2014-09-09 10:37 766 查看
本文由西南交通大学从事计算机视觉相关研究的博士生Xiaojiang Peng 发表在计算机视觉顶级会议ECCV 2014上。从标题可以看出,作者做了两件事情:

(1) 将高阶统计信息引入VLAD。对于字典中的每一个单词,VLAD统计样本上的局部描述子(如SIFT)落在该单词上的描述子与单词的残差累积量。近些年比较流行的做法采用intra-normalization,即对各个单词的残差累计量分别做L2归一化,然后再串成一个长的特征描述子。经过适当变形可发现,VLAD为一阶统计量(均值),一般可理解为样本所有描述子关于各个中心的均值与中心的偏移量。为增强VLAD特征的判别性本文增加了二阶统计量和三阶统计量,即对角协方差与偏斜(skewness)。其中偏斜刻画的是数据到样本中心的不对称性。

(2)字典的有监督学习。先通过kmeans聚类得到字典,然后利用带有标签的样本做字典的有监督学习(本质上是字典自适应)。通过构造成本函数,采用梯度下降法求解分类器参数w和字典D。

本文有些关于实验的细节之处值得注意,如在做VLAD之前先做PCA-whitening。本文提出的高阶统计量应当会带来不少引用。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐