您的位置:首页 > 其它

阅读笔记之:Co-regularized multi-view spectral clustering-NIPS2011

2015-06-15 17:28 435 查看
想法:利用多个视角的信息进行聚类,提高聚类的准确性。很简单直接的原则;不同视角的数据具有潜在(underlying)一致的聚类。以这个为动机,在单视角谱聚类的基础上,增加多视角之间的约束。文章叫做共正则化(co-regularization),我理解的意思是,把多视角之间的约束当做每一个视角的正则化约束。文中还说共正则是在半监督中常见的技术,我觉得这种多视角的数据之间的对应关系也是一种监督信息。Anyway,之后可以看一下在半监督中的co-regularization。

单视角谱聚类:






这个式子中的v代表第v个视角,L代表的是graph的laplacian矩阵,而U的行就是数据的embeddings,得到U之后进行k-means聚类。在这个基础上作者提出了针对多视数据的两种co-regularization。

Pairwise Co-regularization 算法:

对laplacian矩阵特征值分解之后的U是对数据的embedding,也就是新的表达,作者希望在多视情况下,在新的表达情况下的样本相似度是相似的。


K表明样本表达U的相似度矩阵,也就是跨视角的样本相似度矩阵要尽量一致。这个约束加上单视角谱聚类的约束,就是整个表达式,选择线性相似度并化简得到,



优化的过程是要求得每个视角的U。这是两个视角的情况,这个表达式也可以扩展到多视角数据。

Centroid-based Co-regularization 算法:

上面讲的pairwise是指两两视角之间的约束,同一个样本的不同视角的表达仍然是不一样的,在文中作者又提出了一个方案,将每一个视角view-specific的U正则化为同一个Centroid U,类似a consensus set of eigenvectors。 不同于pairwise中成对的两两约束,这里面有多少个视角就有多少个regularization约束。将上式中v和w视角之间的约束改为其中一个视角和centroid U之间的约束就可以了。


这个表达式的优化需要求得每个视角的U和centroid U。

评价:好想法的式子就是漂亮,经典算法很重要,理解深刻,才能做出创新。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息