graph attention network（ICLR2018）官方代码详解（tensorflow）-稀疏矩阵版

之前非稀疏矩阵版的解读：https://www.cnblogs.com/xiximayou/p/13622283.html

我们知道图的邻接矩阵可能是稀疏的，将整个图加载到内存中是十分耗费资源的，因此对邻接矩阵进行存储和计算是很有必要的。

我们已经讲解了图注意力网络的非稀疏矩阵版本，再来弄清其稀疏矩阵版本就轻松了，接下来我们将来看不同之处。

主运行代码在：execute_cora_sparse.py中

同样的，先加载数据：

adj, features, y_train, y_val, y_test, train_mask, val_mask, test_mask = process.load_data(dataset)

其中adj是coo_matrix类型，features是lil_matrix类型。

对于features，我们最终还是：

def preprocess_features(features):

    """Row-normalize feature matrix and convert to tuple representation"""

    rowsum = np.array(features.sum(1))

    r_inv = np.power(rowsum, -1).flatten()

    r_inv[np.isinf(r_inv)] = 0.

    r_mat_inv = sp.diags(r_inv)

    features = r_mat_inv.dot(features)

    return features.todense(), sparse_to_tuple(features)

将其：

features, spars = process.preprocess_features(features)

转换为原始矩阵。

对于biases：

if sparse:

    biases = process.preprocess_adj_bias(adj)

else:

    adj = adj.todense()

    adj = adj[np.newaxis]

    biases = process.adj_to_bias(adj, [nb_nodes], nhood=1)

如果是稀疏格式的，就调用biases = process.preprocess_adj_bias(adj)：

def preprocess_adj_bias(adj):

    num_nodes = adj.shape[0] #

    adj = adj + sp.eye(num_nodes)  # self-loop 给对角上+1

    adj[adj > 0.0] = 1.0 #大于0的值置为1

    if not sp.isspmatrix_coo(adj):

        adj = adj.tocoo()

    adj = adj.astype(np.float32) #类型转换

    indices = np.vstack((adj.col, adj.row)).transpose()  # This is where I made a mistake, I used (adj.row, adj.col) instead

    # return tf.SparseTensor(indices=indices, values=adj.data, dense_shape=adj.shape)

    return indices, adj.data, adj.shape

这里看两个例子：

我们可以通过indices，data，shape来构造一个coo_matrix。

在定义计算图中的占位符时：

       if sparse:

            #bias_idx = tf.placeholder(tf.int64)

            #bias_val = tf.placeholder(tf.float32)

            #bias_shape = tf.placeholder(tf.int64)

            bias_in = tf.sparse_placeholder(dtype=tf.float32)

        else:

            bias_in = tf.placeholder(dtype=tf.float32, shape=(batch_size, nb_nodes, nb_nodes))

使用bias_in = tf.sparse_placeholder(dtype=tf.float32)。

再接着就是模型中了，在utils文件夹下的layers.py中：

# Experimental sparse attention head (for running on datasets such as Pubmed)

# N.B. Because of limitations of current TF implementation, will work _only_ if batch_size = 1!

def sp_attn_head(seq, out_sz, adj_mat, activation, nb_nodes, in_drop=0.0, coef_drop=0.0, residual=False):

    with tf.name_scope('sp_attn'):

        if in_drop != 0.0:

            seq = tf.nn.dropout(seq, 1.0 - in_drop)

        seq_fts = tf.layers.conv1d(seq, out_sz, 1, use_bias=False)

        # simplest self-attention possible

        f_1 = tf.layers.conv1d(seq_fts, 1, 1)

        f_2 = tf.layers.conv1d(seq_fts, 1, 1)

        f_1 = tf.reshape(f_1, (nb_nodes, 1))

        f_2 = tf.reshape(f_2, (nb_nodes, 1))

        f_1 = adj_mat*f_1

        f_2 = adj_mat * tf.transpose(f_2, [1,0])

        logits = tf.sparse_add(f_1, f_2)

        lrelu = tf.SparseTensor(indices=logits.indices,

                values=tf.nn.leaky_relu(logits.values),

                dense_shape=logits.dense_shape)

        coefs = tf.sparse_softmax(lrelu)

        if coef_drop != 0.0:

            coefs = tf.SparseTensor(indices=coefs.indices,

                    values=tf.nn.dropout(coefs.values, 1.0 - coef_drop),

                    dense_shape=coefs.dense_shape)

        if in_drop != 0.0:

            seq_fts = tf.nn.dropout(seq_fts, 1.0 - in_drop)

        # As tf.sparse_tensor_dense_matmul expects its arguments to have rank-2,

        # here we make an assumption that our input is of batch size 1, and reshape appropriately.

        # The method will fail in all other cases!

        coefs = tf.sparse_reshape(coefs, [nb_nodes, nb_nodes])

        seq_fts = tf.squeeze(seq_fts)

        vals = tf.sparse_tensor_dense_matmul(coefs, seq_fts)

        vals = tf.expand_dims(vals, axis=0)

        vals.set_shape([1, nb_nodes, out_sz])

        ret = tf.contrib.layers.bias_add(vals)

        # residual connection

        if residual:

            if seq.shape[-1] != ret.shape[-1]:

                ret = ret + conv1d(seq, ret.shape[-1], 1) # activation

            else:

                ret = ret + seq

        return activation(ret)  # activation

相应的位置都要使用稀疏的方式。

graph attention network（ICLR2018）官方代码详解（tensorflow）-稀疏矩阵版的更多相关文章

graph attention network（ICLR2018）官方代码详解（te4nsorflow）
论文地址:https://arxiv.org/abs/1710.10903 代码地址: https://github.com/Diego999/pyGAT 我并没有完整看过这篇论文,但是在大致了解其原 ...
代码详解：TensorFlow Core带你探索深度神经网络“黑匣子”
来源商业新知网,原标题:代码详解:TensorFlow Core带你探索深度神经网络“黑匣子” 想学TensorFlow?先从低阶API开始吧~某种程度而言,它能够帮助我们更好地理解Tensorflo ...
DeepLearning tutorial（3）MLP多层感知机原理简介+代码详解
本文介绍多层感知机算法,特别是详细解读其代码实现,基于python theano,代码来自:Multilayer Perceptron,如果你想详细了解多层感知机算法,可以参考:UFLDL教程,或者参 ...
ARM Cortex-M底层技术(2)—启动代码详解
杂谈工作了一天,脑袋比较乱.一直想把底层的知识写成一个系列,希望可以坚持下去.为什么要写底层的东西呢?首先,工作用到了这部分内容,最近和内部Flash打交道比较多,自然而然会接触到一些底层的东西:第 ...
论文解读（FedGAT）《Federated Graph Attention Network for Rumor Detection》
论文信息论文标题:Federated Graph Attention Network for Rumor Detection论文作者:Huidong Wang, Chuanzheng Bai, Ji ...
BM算法　　Boyer-Moore高质量实现代码详解与算法详解
Boyer-Moore高质量实现代码详解与算法详解鉴于我见到对算法本身分析非常透彻的文章以及实现的非常精巧的文章,所以就转载了,本文的贡献在于将两者结合起来,方便大家了解代码实现! 算法详解转自:h ...
ASP.NET MVC 5 学习教程：生成的代码详解
原文 ASP.NET MVC 5 学习教程:生成的代码详解起飞网 ASP.NET MVC 5 学习教程目录: 添加控制器添加视图修改视图和布局页控制器传递数据给视图添加模型创建连接字符串 ...
Github-karpathy/char-rnn代码详解
Github-karpathy/char-rnn代码详解 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2016-1-10 ...
十图详解tensorflow数据读取机制（附代码）转知乎
十图详解tensorflow数据读取机制(附代码) - 何之源的文章 - 知乎 https://zhuanlan.zhihu.com/p/27238630

随机推荐

C#LeetCode刷题之#561-数组拆分 I（Array Partition I）
问题该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3718 访问. 给定长度为 2n 的数组, 你的任务是将这些数分成 ...
Kubernetes用Helm安装Ingress并踩一下使用的坑
1 前言欢迎访问南瓜慢说 www.pkslow.com获取更多精彩文章! Ingress是Kubernetes一个非常重要的Controller,它类似一个路由转发的组件,可以让外界访问Kubern ...
存储系列之从ext2到ext3、ext4 的变化与区别
引言:ext3 和 ext4 对 ext2 进行了增强,但是其核心设计并没有发生变化.所以建议先查看上上篇的<存储系列之 Linux ext2 概述 >,有了ext2的基础,看这篇就是so ...
关于华为否认HKSP来自官方的一点看法
今天刷手机,无意看到一则消息: 华为否认提交给 Linux 内核的不安全补丁 HKSP 来自官方这个消息吸引我的原因有几点: 华为被制裁刚满一年,现在由于新冠疫情影响,感觉又处于很敏感的时期: 华为 ...
【转载】PyChram简单使用教程
原文链接:https://www.cnblogs.com/yamei/p/5519818.html 一.PyChram下载官网:http://www.jetbrains.com/pycharm Win ...
什么是BFC？看这一篇就够了
BFC 定义 BFC(Block formatting context)直译为"块级格式化上下文".它是一个独立的渲染区域,只有Block-level box参与, 它规定了内部的 ...
chained get value from nested json
static getValueByKey(o, p, defaultValue = false) { return p.split('.').reduce((r, k) => { if (typ ...
oracle进行一对多关联查询的时候，获取副表（也就是多条记录的那张表）的最新一条记录进行关联，如何获取多条记录最新一条呢？
例如以下场景: 一条新闻对应多条审核记录,用户想知道这条新闻走到哪一步审核了. 使用:select * from (select b.*,(ROW_NUMBER() OVER (PARTITION B ...
iOS多线程之GCD、OperationQueue 对比和实践记录
[toc] 简介在计算的早期,计算机可以执行的最大工作量是由 CPU 的时钟速度决定的.但是随着技术的进步和处理器设计的紧凑化,热量和其他物理约束开始限制处理器的最大时钟速度.因此,芯片制 ...
Java面试题（Mybatis篇）
Mybatis 125.mybatis 中 #{}和 ${}的区别是什么? #{}是预编译处理,${}是字符串替换: Mybatis在处理#{}时,会将sql中的#{}替换为?号,调用Prepared ...

graph attention network（ICLR2018）官方代码详解（tensorflow）-稀疏矩阵版

graph attention network（ICLR2018）官方代码详解（tensorflow）-稀疏矩阵版的更多相关文章

随机推荐

热门专题