论文信息

论文标题：MaskGAE: Masked Graph Modeling Meets Graph Autoencoders
论文作者：Jintang Li, Ruofan Wu, Wangbin Sun, Liang Chen, Sheng Tian......
论文来源：2022,arXiv
论文地址：download
论文代码：download

1 Introduction

　　MAE 在图上的应用——2022 最潮的方法。

2 Related work and Motivation

2.1 GAE

　　GAEs采用了经典的编码器-解码器框架，旨在通过优化以下二进制交叉熵损失，从编码图的低维表示中进行解码：

　　　　$\mathcal{L}_{\mathrm{GAEs}}=-\left(\frac{1}{\left|\mathcal{E}^{+}\right|} \sum\limits _{(u, v) \in \mathcal{E}^{+}} \log h_{\omega}\left(z_{u}, z_{v}\right)+\frac{1}{\left|\mathcal{E}^{-}\right|} \sum\limits _{\left(u^{\prime}, v^{\prime}\right) \in \mathcal{E}^{-}} \log \left(1-h_{\omega}\left(z_{u^{\prime}}, z_{v^{\prime}}\right)\right)\right)$

　　其中，$\mathcal{z}$ 代表低维隐表示，$f_{\theta}$ 代表参数为 $\theta$ 的 GNN encoder，$h_{\omega}$ 代表参数为 $\omega$ 的 GNN decoder，$\mathcal{E}^{+}$ 代表 positive edges ，$\mathcal{E}^{-}$ 代表 negative edges 。

2.2 Motivation

　　按照互信息的思想：希望最大化 k-hop 节点对子图之间的一致性，但是伴随着 $K$ 值变大，过平滑的问题越发明显，此时子图大小对节点表示的学习不利。因此有：

　　Proposition 1：

　　分析了一堆废话................

　　后面呢，必然出现解决过平滑的策略。

　　Recall：解决过平湖的策略

- 残差；
- 谱图理论；
- 多尺度信息；
- 边删除；

3 Method：MaskGAE

　　我们提出了 MGM 代理任务的 MaskGAE 框架：

　　出发点：MGM

　　　　$\mathcal{G}_{\text {mask }} \cup \mathcal{G}_{\text {vis }}=\mathcal{G}$

　　　　$\mathcal{G}_{\text {mask }}= \left(\mathcal{E}_{\text {mask }}, \mathcal{V}\right)$

3.1 Masking strategy

Edge-wise random masking $(\mathcal{T}_{\text {edge }}$

　　　　$\mathcal{E}_{\text {mask }} \sim \operatorname{Bernoulli}(p)$

Path-wise random masking $(\mathcal{T}_{\text {path}}$

　　　　$\mathcal{E}_{\text {mask }} \sim \operatorname{Random} \operatorname{Walk}\left(\mathcal{R}, n_{\text {walk }}, l_{\text {walk }}\right)$

　　其中，$\mathcal{R} \subseteq \mathcal{V}$ 是从图中采样的一组根节点，$n_{\text {walk }}$ 为每个节点的行走次数，$l_{\text {walk }}$ 为行走长度。

　　在这里，我们遵循度分布，抽样了一个节点的子集（例如，50%），没有替换作为根节点 $\mathcal{R}$。这样的采样也可以防止图中存在的潜在的长尾偏差（即，更多的屏蔽边是那些属于高度节点的边）。

3.2 Encoder

GCN Encoder
SAGE Encoder
GAT Encoder

3.2 Decoder

Structure decoder

　　　　$h_{\omega}\left(z_{i}, z_{j}\right)=\operatorname{Sigmoid}\left(z_{i}^{\mathrm{T}} z_{j}\right)$

　　　　$h_{\omega}\left(z_{i}, z_{j}\right)=\operatorname{Sigmoid}\left(\operatorname{MLP}\left(z_{i} \circ z_{j}\right)\right)$

Degree decoder

　　　　$g_{\phi}\left(z_{v}\right)=\operatorname{MLP}\left(z_{v}\right)$

3.3 Learning objective

　　损失函数包括：

- Reconstruction loss：计算的是掩码边 $\mathcal{E}^{+}=\mathcal{E}_{\text {mask }}$ 的重构损失；
- Regression loss：衡量的是节点度的预测与掩蔽图中原始节点度的匹配程度：

　　　　　　$\mathcal{L}_{\mathrm{deg}}=\frac{1}{|\mathcal{V}|} \sum\limits _{v \in \mathcal{V}}\left\|g_{\phi}\left(z_{v}\right)-\operatorname{deg}_{\text {mask }}(v)\right\|_{F}^{2}$

　　其中，$\operatorname{deg}_{\text {mask }}$ 代表的是掩码图 $\mathcal{G}_{\text {mask }}$ 的节点度。

　　因此，总体损失为：

　　　　$\mathcal{L}=\mathcal{L}_{\mathrm{GAEs}}+\alpha \mathcal{L}_{\mathrm{deg}}$

4 Experiments

Link prediction

node classifification

5 Conclusion

　　在这项工作中，我们首次研究了掩蔽图建模(MGM)，并提出了MaskGAE，一个基于理论基础的自我监督学习框架，以 MGM 作为一个有原则的借口任务。我们的工作在理论上是基于以下理由：(i)气体本质上是对比学习，使与链接边相关的配对子图视图之间的互信息最大化；(ii)MGM可以有利于互信息最大化，因为掩蔽显著减少了两个子图视图之间的冗余。特别是，我们还提出了一种路径掩蔽策略，以促进米高梅的任务。在我们的实验中，MaskGAE 比 GAE 表现出显著改善的性能，并且在链路预测和节点分类基准上与强基线相当或更好。

论文解读（MaskGAE）《MaskGAE: Masked Graph Modeling Meets Graph Autoencoders》的更多相关文章

论文解读(GraphDA)《Data Augmentation for Deep Graph Learning: A Survey》
论文信息论文标题:Data Augmentation for Deep Graph Learning: A Survey论文作者:Kaize Ding, Zhe Xu, Hanghang Tong, ...
论文解读（SUGRL）《Simple Unsupervised Graph Representation Learning》
Paper Information Title:Simple Unsupervised Graph Representation LearningAuthors: Yujie Mo.Liang Pen ...
论文解读（GraRep）《GraRep: Learning Graph Representations with Global Structural Information》
论文题目:<GraRep: Learning Graph Representations with Global Structural Information>发表时间: CIKM论文作 ...
论文解读（MCGC）《Multi-view Contrastive Graph Clustering》
论文信息论文标题:Multi-view Contrastive Graph Clustering论文作者:Erlin Pan.Zhao Kang论文来源:2021, NeurIPS论文地址:down ...
论文解读（CGC）《CGC: Contrastive Graph Clustering for Community Detection and Tracking》
论文信息论文标题:CGC: Contrastive Graph Clustering for Community Detection and Tracking论文作者:Namyong Park, R ...
论文解读（GROC）《Towards Robust Graph Contrastive Learning》
论文信息论文标题:Towards Robust Graph Contrastive Learning论文作者:Nikola Jovanović, Zhao Meng, Lukas Faber, Ro ...
论文解读（DAGNN）《Towards Deeper Graph Neural Networks》
论文信息论文标题:Towards Deeper Graph Neural Networks论文作者:Meng Liu, Hongyang Gao, Shuiwang Ji论文来源:2020, KDD ...
论文解读（SCGC)）《Simple Contrastive Graph Clustering》
论文信息论文标题:Simple Contrastive Graph Clustering论文作者:Yue Liu, Xihong Yang, Sihang Zhou, Xinwang Liu论文来源 ...
论文解读（Geom-GCN）《Geom-GCN: Geometric Graph Convolutional Networks》
Paper Information Title:Geom-GCN: Geometric Graph Convolutional NetworksAuthors:Hongbin Pei, Bingzhe ...

随机推荐

java.sql和javax.sql的区别
根据 JDBC 规范,javax.sql 包中的类和接口首先作为 JDBC 2.0 可选包提供.此可选程序包以前与 J2SE1.2 中的 java.sql 程序包是分开的.从 J2SE1.4 开始,这 ...
Dapr学习（2）之Rancher2.63（k8s&k3s）环境安装Dapr
前言:前面写过一篇关于dapr入门安装的文章,self-host模式,使用docker安装的本地调试环境,并进行了测试:本篇介绍k8s方式安装dapr,此文主要基于的环境是k3s,通过rancher2 ...
Spring Boot 2.7.0发布，2.5停止维护，节奏太快了吧
这几天是Spring版本日,很多Spring工件都发布了新版本, Spring Framework 6.0.0 发布了第 4 个里程碑版本,此版本包含所有针对 5.3.20 的修复补丁,以及特定于 6 ...
阿里云OSS + PicGo搭建图床
1.阿里云 OSS 登录阿里云,进入控制台. 打开侧边栏,找到对象存储 OSS. 右侧找到 Bucket 管理,点击创建 Bucket. 根据引导配置 Bucket 其他同城冗余存储和版本控制等增值服 ...
白嫖Azure与体验GoLand远程开发
前言近期因为有本地开发远程使用Linux编译部署的需求,而虚拟机的性能实在是不敢恭维,WSL的坑之前也踩过(没有systemd等),故考虑使用SSH连接云服务器开发. 目前VSCode提出了Remo ...
分布式机器学习：PageRank算法的并行化实现（PySpark）
1. PageRank的两种串行迭代求解算法我们在博客<数值分析:幂迭代和PageRank算法(Numpy实现)>算法中提到过用幂法求解PageRank. 给定有向图我们可以写出其马尔 ...
「Java分享客栈」Nacos配置中心称王称霸，我Apollo一生也不弱于人！
前言 Apollo又称阿波罗配置中心,在前两年还是挺火的,但阿里SpringCloud套件席卷国内之后,nacos就成为了最被亲睐的分布式配置中心,nacos是配置中心和注册中心二合一的产品,单纯功能 ...
【SpringSecurity系列1】基于SpringSecurity实现前后端分离无状态Rest API的权限控制
源码传送门: https://github.com/ningzuoxin/zxning-springsecurity-demos/tree/master/01-springsecurity-state ...
即时通讯IM，是时代进步的逆流？看看JNPF怎么说
JNPF快速开发平台所包含的第四个重要的开发框架是即时通讯沟通工具.即时沟通工具的目的是让各大企事业单位在各种业务工作流程环境下实现实时无缝协同办公,打破信息数据孤岛,形成高效的层级流转审批和各流程环 ...
对TCP粘包拆包的理解
TCP的粘包与拆包 TCP是一种字节流(byte-stream)协议,所谓流,就是没有界限的一串数据. 一个完整的包会被TCP拆为多个包进行发送,也有可能把多个小包封装成一个大的数据包发送,这就是所谓 ...

论文解读（MaskGAE）《MaskGAE: Masked Graph Modeling Meets Graph Autoencoders》