您的位置：首页 > 其它

阅读笔记之：Co-regularized multi-view spectral clustering-NIPS2011

2015-06-15 17:28 435 查看

想法：利用多个视角的信息进行聚类，提高聚类的准确性。很简单直接的原则；不同视角的数据具有潜在（underlying）一致的聚类。以这个为动机，在单视角谱聚类的基础上，增加多视角之间的约束。文章叫做共正则化（co-regularization），我理解的意思是，把多视角之间的约束当做每一个视角的正则化约束。文中还说共正则是在半监督中常见的技术，我觉得这种多视角的数据之间的对应关系也是一种监督信息。Anyway，之后可以看一下在半监督中的co-regularization。

单视角谱聚类：

这个式子中的v代表第v个视角，L代表的是graph的laplacian矩阵，而U的行就是数据的embeddings，得到U之后进行k-means聚类。在这个基础上作者提出了针对多视数据的两种co-regularization。

Pairwise Co-regularization 算法：

对laplacian矩阵特征值分解之后的U是对数据的embedding，也就是新的表达，作者希望在多视情况下，在新的表达情况下的样本相似度是相似的。

K表明样本表达U的相似度矩阵，也就是跨视角的样本相似度矩阵要尽量一致。这个约束加上单视角谱聚类的约束，就是整个表达式，选择线性相似度并化简得到，

优化的过程是要求得每个视角的U。这是两个视角的情况，这个表达式也可以扩展到多视角数据。

Centroid-based Co-regularization 算法：

上面讲的pairwise是指两两视角之间的约束，同一个样本的不同视角的表达仍然是不一样的，在文中作者又提出了一个方案，将每一个视角view-specific的U正则化为同一个Centroid U，类似a consensus set of eigenvectors。不同于pairwise中成对的两两约束，这里面有多少个视角就有多少个regularization约束。将上式中v和w视角之间的约束改为其中一个视角和centroid U之间的约束就可以了。

这个表达式的优化需要求得每个视角的U和centroid U。

评价：好想法的式子就是漂亮，经典算法很重要，理解深刻，才能做出创新。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 正则 clustering 多视数据谱聚类

相关文章推荐

新的分享

章节导航