您的位置：首页 > 其它

文献阅读笔记——Boosting VLAD with Supervised Dictionary Learning and High-Order Statistics

2014-09-09 10:37 766 查看

本文由西南交通大学从事计算机视觉相关研究的博士生Xiaojiang Peng 发表在计算机视觉顶级会议ECCV 2014上。从标题可以看出，作者做了两件事情：

（1）将高阶统计信息引入VLAD。对于字典中的每一个单词，VLAD统计样本上的局部描述子（如SIFT）落在该单词上的描述子与单词的残差累积量。近些年比较流行的做法采用intra-normalization，即对各个单词的残差累计量分别做L2归一化，然后再串成一个长的特征描述子。经过适当变形可发现，VLAD为一阶统计量（均值），一般可理解为样本所有描述子关于各个中心的均值与中心的偏移量。为增强VLAD特征的判别性本文增加了二阶统计量和三阶统计量，即对角协方差与偏斜（skewness）。其中偏斜刻画的是数据到样本中心的不对称性。

（2）字典的有监督学习。先通过kmeans聚类得到字典，然后利用带有标签的样本做字典的有监督学习（本质上是字典自适应）。通过构造成本函数，采用梯度下降法求解分类器参数w和字典D。

本文有些关于实验的细节之处值得注意，如在做VLAD之前先做PCA-whitening。本文提出的高阶统计量应当会带来不少引用。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航