您的位置：首页 > Web前端

论文解读（SupCosine）《Supervised Contrastive Learning with Structure Inference for Graph Classification》

2022-04-02 21:20 1471 查看

论文信息

论文标题：Supervised Contrastive Learning with Structure Inference for Graph Classification
论文作者：Hao Jia, Junzhong Ji, Minglong Lei
论文来源：2022, ArXiv
论文地址：download
论文代码：download

Abstract

　　任务：Graph Classification

　　对比：

[li]Node classification，从局部邻居获得的节点表示向量可以直接用于获得节点标签。

[/li]

　　　　　　$\begin{array}{l}a_{v}^{(k)}=\operatorname{AGGREGATE}^{(k)}\left(\left\{h_{u}^{(k-1)}: u \in \mathcal{N}(v)\right\}\right) \\h_{v}^{(k)}=\operatorname{COMBINE}^{(k)}\left(h_{v}^{(k-1)}, a_{v}^{(k)}\right)\end{array}$

[li]Graph classification，需要获得不同层次的图结构信息，从而获得具有判别性的图表示向量。

[/li]

　　　　　　$h_{G}=\operatorname{READOUT}\left(\left\{h_{v}^{(K)} \mid v \in G\right\}\right)$

背景知识

　　先前工作存在的问题　　数据增强方面：常见的方法如 node dropping、attribute masking、random walks，受潜在先验的制约。　　举例：随机游走（random walk）

[li]从当前节点以相同概率选择邻居节点进行游走；　　
每个随机游走序列的长度为 $k$ ；　　
对图中每个节点生成 $r$ 个随机游走序列；

[/li]

　　随机游走产生的问题

[li]不稳定，当采样频率或节点序列数目发生改变。　　
在带有高度偏见的网络中，随机游走倾向于度高的节点，从而忽略了全局信息。

[/li] 　　

　　先前工作存在的问题

　　图对比学习方面：图上广泛使用的框架常是自监督形式，该类框架的对比损失基于一个正样本与一个负样本对比或一个正样本与多个负样本对比，这导致了对比能力有限。

　　Triplet loss 　　　　$\underset{x, x^{+}, x^{-}}{\mathbb{E}}\left[-\log \left(\frac{e^{f(x)^{T} f\left(x^{+}\right)}}{e^{f(x)^{T}} f\left(x^{+}\right)+e^{f(x)^{T} f\left(x^{-}\right)}}\right)\right]$ 　　优化目标：拉近 Anchor 和 Postive的距离，拉远 Anchor 和 Negative 的距离。

　　InfoNCE Loss

　　　　$\mathcal{L}_{N}=-\mathbb{E}_{X}\left[\log \frac{\overline{\exp \left(f(x)^{T} f\left(x^{+}\right)\right)}}{\underline{\exp \left(f(x)^{T} f\left(x^{+}\right)\right)}+\sum_{j=1}^{N-1} \exp \left(f(x)^{T} f\left(x_{j}\right)\right)}\right]$

　　最小化这一损失能够最大化锚点数据和正样本互信息的下界，加大互信息。