自编码器是无监督学习领域中一个非常重要的工具。最近由于图神经网络的兴起，图自编码器得到了广泛的关注。笔者最近在做相关的工作，对科研工作中经常遇到的：自编码器（AE），变分自编码器（VAE），图自编码器（GAE）和图变分自编码器（VGAE）进行了总结。如有不对之处，请多多指正。

另外，我必须要强调的一点是：很多文章在比较中将自编码器和变分自编码器视为一类，我个人认为，这二者的思想完全不同。自编码器的目的不是为了得到latent representation（中间层），而是为了生成新的样本。我自己的实验得出的结论是，变分自编码器和变分图自编码器生成的中间层不能直接用来做下游任务（聚类、分类等），这是一个坑。

自编码器（AE）

在解释图自编码器之前，首先理解下什么是自编码器。自编码器的思路来源于传统的PCA，其目的可以理解为非线性降维。我们知道在传统的PCA中，学习器学得一个子空间矩阵，将原始数据投影到一个低维子空间，从未达到数据降维的目的。自编码器则是利用神经网络将数据逐层降维，每层神经网络之间得激活函数就起到了将"线性"转化为"非线性"的作用。自编码器的网络结构可以是对称的也可以是非对称的。我们下面以一个简单的四层对称的自编码器为例，全文代码见最后

(严格的自编码器是只有一个隐藏层，但是我在这里把几种不同的自编码器统称为自编码器，其最大的区别就是隐藏层以及神经元数量的多少，理解一个，其它的都就理解了)

图自编码器（GAE）

图自编码器和自编码器最大的区别有两点：一是图自编码器在encoder过程中使用了一个（n*n）的卷积核；另一个是图编码器没有数据解码部分，转而代之的是图decoder。

图自编码器可以像自编码器那样用来生成隐向量，也可以用来做链路预测（类似于推荐任务）。

变分自编码器（VAE）

变分自编码是让中间层Z服从一个分布。这样我们想要生成一个新的样本的时候，就可以直接在特定分布中随机抽取一个样本。

另外，我初学时遇到的疑惑，就是中间层是怎么符合分布的。我的理解是：

输入样本：$\mathbf{X \in \mathcal{R}^{n * d}}$

中间层：$\mathbf{Z \in \mathcal{R}^{n * m}}$

所谓的正态分布是让$Z$的每一行$z_i$符合正态分布，这样才能随机从正态分布中抽一个新的$z_i$出来。但是正是这个原因，我认为$Z$不能直接用来处理下游任务（分类、聚类）,我自己跑实验确实效果不好。

变分图自编码器（VGAE）

如果你理解了变分比编码器和图自编码器，那么变分图自编码器你也就能理解了。第一个改动就是在VAE的基础上把encoder过程换成了GCN的卷积过程，另一个改动就是把decoder过程换成了图decoder过程。同样生成的中间层隐向量不能直接应用下游任务。

数据集和下游任务的代码见: https://github.com/zyx423/GAE-and-VGAE.git

全文代码如下：

class myAE(torch.nn.Module):

    def __init__(self, d_0, d_1, d_2, d_3, d_4):

        super(myAE, self).__init__()

        // 这里的d0, d_1, d_2, d_3, d_4对应四层神经网络的维度

        self.conv1 = torch.nn.Sequential(

            torch.nn.Linear(d_0, d_1, bias=False),

            torch.nn.ReLU(inplace=True)

        )

        self.conv2 = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False),

            torch.nn.ReLU(inplace=True)

        )

        self.conv3 = torch.nn.Sequential(

            torch.nn.Linear(d_2, d_3, bias=False),

            torch.nn.ReLU(inplace=True)

        )

        self.conv4 = torch.nn.Sequential(

            torch.nn.Linear(d_3, d_4, bias=False),

            torch.nn.Sigmoid()

        )

    def Encoder(self, H_0):

        H_1 = self.conv1(H_0)

        H_2 = self.conv2(H_1)

        return H_2

    def Decoder(self, H_2):

        H_3 = self.conv3(H_2)

        H_4 = self.conv4(H_3)

        return H_4

    def forward(self, H_0):

        Latent_Representation = self.Encoder(H_0)

        Features_Reconstrction = self.Decoder(Latent_Representation)

        return Latent_Representation, Features_Reconstrction

class myGAE(torch.nn.Module):

    def __init__(self, d_0, d_1, d_2):

        super(myGAE, self).__init__()

        self.gconv1 = torch.nn.Sequential(

            torch.nn.Linear(d_0, d_1, bias=False),

            torch.nn.ReLU(inplace=True)

        )

        self.gconv1[0].weight.data = get_weight_initial(d_1, d_0)

        self.gconv2 = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False)

        )

        self.gconv2[0].weight.data = get_weight_initial(d_2, d_1)

    def Encoder(self, Adjacency_Modified, H_0):

        H_1 = self.gconv1(torch.matmul(Adjacency_Modified, H_0))

        H_2 = self.gconv2(torch.matmul(Adjacency_Modified, H_1))

        return H_2

    def Graph_Decoder(self, H_2):

        graph_re = Graph_Construction(H_2)

        Graph_Reconstruction = graph_re.Middle()

        return Graph_Reconstruction

    def forward(self, Adjacency_Modified, H_0):

        Latent_Representation = self.Encoder(Adjacency_Modified, H_0)

        Graph_Reconstruction = self.Graph_Decoder(Latent_Representation)

        return Graph_Reconstruction, Latent_Representation

class myVAE(torch.nn.Module):

    def __init__(self, d_0, d_1, d_2, d_3, d_4, bias=False):

        super(myVAE, self).__init__()

        self.conv1 = torch.nn.Sequential\

        (

            torch.nn.Linear(d_0, d_1, bias= False),

            torch.nn.ReLU(inplace=True)

        )

        # VAE有两个encoder，一个用来学均值，一个用来学方差

        self.conv2_mean = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False)

        )

        self.conv2_std = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False)

        )

        self.conv3 = torch.nn.Sequential(

            torch.nn.Linear(d_2, d_3, bias=False),

            torch.nn.ReLU(inplace=False)

        )

        self.conv4 = torch.nn.Sequential(

            torch.nn.Linear(d_3, d_4, bias=False),

            torch.nn.Sigmoid()

        )

    def Encoder(self, H_0):

        H_1 = self.conv1(H_0)

        H_2_mean = self.conv2_mean(H_1)

        H_2_std = self.conv2_std(H_1)

        return H_2_mean, H_2_std

    def Reparametrization(self, H_2_mean, H_2_std):

        # sigma = 0.5*exp(log(sigma^2))= 0.5*exp(log(var))

        std = 0.5 * torch.exp(H_2_std)

        # N(mu, std^2) = N(0, 1) * std + mu。

        # 数理统计中的正态分布方差，刚学过， std是方差。

        # torch.randn 生成正态分布

        Latent_Representation = torch.randn(std.size()) * std + H_2_mean

        return Latent_Representation

    # 解码隐变量

    def Decoder(self, Latent_Representation):

        H_3 = self.conv3(Latent_Representation)

        Features_Reconstruction = self.conv4(H_3)

        return Features_Reconstruction

    # 计算重构值和隐变量z的分布参数

    def forward(self, H_0):

        H_2_mean, H_2_std = self.Encoder(H_0)

        Latent_Representation = self.Reparametrization(H_2_mean, H_2_std)

        Features_Reconstruction = self.Decoder(Latent_Representation)

        return Latent_Representation, Features_Reconstruction, H_2_mean, H_2_std

class myVGAE(torch.nn.Module):

    def __init__(self, d_0, d_1, d_2):

        super(myVGAE, self).__init__()

        self.gconv1 = torch.nn.Sequential(

            torch.nn.Linear(d_0, d_1, bias=False),

            torch.nn.ReLU(inplace=True)

        )

        # self.gconv1[0].weight.data = get_weight_initial(d_1, d_0)

        self.gconv2_mean = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False)

        )

        # self.gconv2_mean[0].weight.data = get_weight_initial(d_2, d_1)

        self.gconv2_std = torch.nn.Sequential(

            torch.nn.Linear(d_1, d_2, bias=False)

        )

        # self.gconv2_std[0].weight.data = get_weight_initial(d_2, d_1)

    def Encoder(self, Adjacency_Modified, H_0):

        H_1 = self.gconv1(torch.matmul(Adjacency_Modified, H_0))

        H_2_mean = self.gconv2_mean(torch.matmul(Adjacency_Modified, H_1))

        H_2_std = self.gconv2_std(torch.matmul(Adjacency_Modified, H_1))

        return H_2_mean, H_2_std

    def Reparametrization(self, H_2_mean, H_2_std):

        # sigma = 0.5*exp(log(sigma^2))= 0.5*exp(log(var))

        std = 0.5 * torch.exp(H_2_std)

        # N(mu, std^2) = N(0, 1) * std + mu。

        # 数理统计中的正态分布方差，刚学过， std是方差。

        # torch.randn 生成正态分布

        Latent_Representation = torch.randn(std.size()) * std + H_2_mean

        return Latent_Representation

    # 解码隐变量

    def Graph_Decoder(self, Latent_Representation):

        graph_re = Graph_Construction(Latent_Representation)

        Graph_Reconstruction = graph_re.Middle()

        return Graph_Reconstruction

    def forward(self, Adjacency_Modified, H_0):

        H_2_mean, H_2_std = self.Encoder(Adjacency_Modified, H_0)

        Latent_Representation = self.Reparametrization(H_2_mean, H_2_std)

        Graph_Reconstruction = self.Graph_Decoder(Latent_Representation)

        return Latent_Representation, Graph_Reconstruction, H_2_mean, H_2_std

变分（图）自编码器不能直接应用于下游任务（GAE, VGAE, AE, VAE and SAE）的更多相关文章

编码器AE & VAE
学习总结于国立台湾大学 :李宏毅老师自编码器 AE (Auto-encoder) & 变分自动编码器VAE(Variational Auto-encoder) ...
x264源代码简单分析：编码器主干部分-2
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
x264源代码简单分析：编码器主干部分-1
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
电机AB相编码器测速
控制任务检测编码器的脉冲并测速电路设计图1 直流电机带减速器和编码器图2 编码器接线定义编码器接线定义如下 M1:电机电源接口,绿色的 GND:编码器电源负极输入口,橙色的 C1:编码器A ...
图机器学习(GML)&图神经网络(GNN)原理和代码实现(前置学习系列二）
项目链接:https://aistudio.baidu.com/aistudio/projectdetail/4990947?contributionType=1 欢迎fork欢迎三连!文章篇幅有限, ...
Pytorch入门之VAE
关于自编码器的原理见另一篇博客 : 编码器AE & VAE 这里谈谈对于变分自编码器(Variational auto-encoder)即VAE的实现. 1. 稀疏编码首先介绍一下“稀疏编码 ...
GAN与VAE
经典算法·GAN与VAE Generative Adversarial Networks 及其变体生成对抗网络是近几年最为经典的生成模型的代表工作,Goodfellow的经典工作.通过两个神经网络结 ...
自动编码(AE)器的简单实现
一.目录自动编码(AE)器的简单实现一.目录二.自动编码器的发展简述 2.1 自动编码器(Auto-Encoders,AE) 2.2 降噪自编码(Denoising Auto-Encoders, ...
论文解读（S^3-CL）《Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning》
论文信息论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...

随机推荐

关于idea的一次踩坑记录-Auto build completed with errors
maven项目添加pom依赖后,一直不能正常导入所依赖的jar包,并且报错“ Auto build completed with errors”
Bootstrap组件的使用
五.常用组件总结: boot中事件,关注两件事 1.事件是如何触发的.自定义属性触发,触发方式是这个属性的值 2.事件触发的目标 button绑定目标 data-target="#id&q ...
Django之ORM外部python脚本使用
python脚本使用django的ROM 如果你想通过自己创建的python文件在django项目中使用django的models,那么就需要调用django的环境: 在总的项目文件夹创建的py文件: ...
java 精确加减
/** * 提供精确的加法运算. * @param v1 被加数 * @param v2 加数 * @return 两个参数的和 */ public double add(double v1, dou ...
SQL——CREATE、ALTER、DROP和VIEW
CREATE DATABASE - 创建新数据库语法:CREATE DATABASE database_nameALTER DATABASE - 修改数据库 CREATE TABLE - ...
zepto快速入门教程
* zepto* 特点:1.体积8kb2.针对移动端的框架3.语法同jquery大部分一样,都是$为核心函数4.目前功能完善的框架体积最小的左右* 同jquery相似的语法核心:$--作为函数使用参数 ...
Intellij IDEA 2020.1.1 破解永久有效亲测100%成功
申明:本教程 WebStorm 破解补丁.激活码均收集于网络,请勿商用,仅供个人学习使用,如有侵权,请联系作者删除. 前言作为一个有强迫症的码农,怎么能忍受自己的开发工具跟不上潮流呢?笔者以前一直用 ...
switch-case与if-else的转换
对学会成绩大于60分的,输出合格,低于60分的输出不合格 import java.util.Scanner; public class TestSwitch3 { public static void ...
安卓全屏或沉浸式状态栏下输入框（EditText）被键盘遮挡解决方法
沉浸式状态栏用了一段时间了,一直没发现安卓在这方面的坑.最近在集成环信自定义UI的过程中,发现将环信界面设置为沉浸式之后最底部的消息输入框不随键盘弹起而变化了,一直显示在屏幕最下方,体验非常差. 后来 ...
django-CBV刨析、模板层
今日内容概要 CBV源码剖析模版层模版语法传值模版语法之过滤器模版语法之标签自定义过滤器.标签及inclusion_tag 模版的继承模版的导入 FBV与CBV ""& ...