NEU(Fst Network Embedding Enhancement via High Order Proximity Approximation)

NEU:通过对高阶相似性的近似,加持快速网络嵌入

NRL的框架总结

  • First, Clarify the notations and formalize the problem of NRL.
  • Then, Introduce the concept of k-order proximity.
  • Finally, Summarize an NRL framework based on proximity matrix factorization and show that the aforementioned NRL methods fall into the category.

定义本文处理的图是无权无向图。这也是他的局限性。这是一个NEU算法的缺点!

对角阵 \(D_{ii}=d_i\)是\(v_i\)节点的度。\(A=D^{-1} \widetilde A\) ,是对邻接矩阵\(\widetilde A\)的归一化结果。
Laplacian Matrix: \(\widetilde L = D - \widetilde A\), 这是把\(\widetilde A\)全取反再在对角线上加上\(v_i\)的度数。
Normalized Laplacian Matrix: $ L = D^{-\frac{1}{2}}\widetilde L D^{-\frac{1}{2}} $

这俩Laplacian matrix 拿来何用?

K-order proximity

$ A\(和\)\widetilde L$ characterize 一阶相似性,建模局部节点对的proximity。
还是沿用GraRep的K-step转移概率矩阵:transition probability matrix 作为k-order proximity matrix.
\(A^k = \underbrace{A \cdot A ... A}_{k}\)

NRL Framework

Step1: Proximity Matrix Construction 相似性矩阵建立
相似性矩阵\(M \in \mathbb R^{|V|\times |V|}\)编码了 \(k\) 阶相似性,\(k = 1,2,...,K\) .有\(A\)是normalized邻接矩阵, \(M=\frac{A+A^2+...+A^K}{K}\)表示了K阶相似性矩阵的联合再平均。\(M\)通常是由\(A\)的\(K\)级的多项式表示,文章记为\(f(A) \in \mathbb R^{|V|\times |V|}\), \(K\)级是多少,depends on 相似度矩阵proximity matrix要表达的最大的proximity阶数。

Step2: Dimension Reduction 维数约减
寻找2个矩阵,\(R\) 和 \(C\).

  • \(R \in \mathbb R^{|V|\times d}\) 是节点的低维向量表达,
  • \(C \in \mathbb R^{|V|\times d}\)是context角色时,节点的低维向量表达。

矩阵的乘积\(R \cdot C^T\)就是对原网络的相似性矩阵\(M\)的近似。这里,不同的算法对\(R \cdot C^T\)和\(M\)的距离有不同的描述,employ different distance function. 比如,用\(M- R \cdot C^T\)

前人的方法与本框架的关系
Spectral Clustering:
DeepWalk:
GraRep:
TADW:
LINE:

观察和Problem Formalization

既然是2步框架,第一步是建立proximity matrix,怎么建立一个好的proximity matrix for NRL.在这篇文章里讨论。
至于第二步,维数约减,future Work.

Observation 1: 更高阶的,和更精确的proximity matrix可以提升模型的学习效果。也就是说,如果探索一个更高阶的polynomial proximity matrix \(f(A)\),NRL可以因此受益。

Observation 2:对大规模网络来说,对高阶的proximity matrix的精确计算是不可行的。实际上对proximity matrix的计算takes \(O(|V|^2)\) time. SVD的时间复杂度也随k 的增大,get dense,从而增加。

其实Observation1&2是矛盾的,前者要更精确,更高阶。后者又表明越高阶越难算。
因此如何高效地获得高阶的proximity matrix变为一个问题。
文章的解决方案是,先对低阶的proximity matrix的信息进行编码,以此作为一个基础,来避免重复的计算。

问题的构建
有个假设,\(R\)和\(C\)是某个NRL算法学到的表达,\(R \cdot C^T\) 对\(K\)阶的多项式proximity matrix \(f(A)\) 构成近似。目的就是学到一个更好的\(R'\)和\(C'\),它俩可以构成对\(g(A)\)的近似,这个\(g(A)\)比\(f(A)\)更高阶。并且,算法还要高效,should be efficient in the linear time of \(|V|\). 注意,时间复杂度下界是\(O(|V|d)\) ,which is the size of embedding matrix \(R\).

NEU(Fst Network Embedding Enhancement via High Order Proximity Approximation)的更多相关文章

  1. [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximati

    [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximation 本文结构 解决问题 主要贡献 主要 ...

  2. Network Embedding 论文小览

    Network Embedding 论文小览 转自:http://blog.csdn.net/Dark_Scope/article/details/74279582,感谢分享! 自从word2vec横 ...

  3. network embedding 需读论文

    Must-read papers on NRL/NE. github: https://github.com/nate-russell/Network-Embedding-Resources NRL: ...

  4. 论文:network embedding

    KDD2016: network embedding model: deep walk(kdd 2014): http://videolectures.net/kdd2014_perozzi_deep ...

  5. On the Optimal Approach of Survivable Virtual Network Embedding in Virtualized SDN

    Introduction and related work 云数据中心对于虚拟技术是理想的创新地方. 可生存性虚拟网络映射(surviavable virtual network embedding ...

  6. Content to Node: Self-Translation Network Embedding

    paper:https://dl.acm.org/citation.cfm?id=3219988 data & code:http://dm.nankai.edu.cn/code/STNE.r ...

  7. Context-Aware Network Embedding for Relation Modeling

    Context-Aware Network Embedding for Relation Modeling 论文:http://www.aclweb.org/anthology/P17-1158 创新 ...

  8. Network Embedding

    网络表示 网络表示学习(DeepWalk,LINE,node2vec,SDNE) https://blog.csdn.net/u013527419/article/details/76017528 网 ...

  9. 论文阅读:Relation Structure-Aware Heterogeneous Information Network Embedding

    Relation Structure-Aware Heterogeneous Information Network Embedding(RHINE) (AAAI 2019) 本文结构 (1) 解决问 ...

随机推荐

  1. phpmailer SMTP connect() failed的解决方法

    使用PHPMailer发邮件的时候,经常出现本地可以发送,上传到服务器就发送失败了.老是提示SMTP connect() failed 今天我也遇到了这样的问题,用的是QQ的邮箱服务器,查了下资料,很 ...

  2. InfluxDB 1.6文档

    警告!此页面记录了不再积极开发的InfluxDB的早期版本.InfluxDB v1.7是InfluxDB的最新稳定版本. InfluxDB是一个时间序列数据库,旨在处理高写入和查询负载.它是TICK堆 ...

  3. TeamViewer 的早期版本下载

    对于10及上以的:https://www.teamviewer.com/zhcn/download/previous-versions/ 5~9的版本下载:https://community.team ...

  4. 简单明了区分IE,Firefox,chrome主流浏览器

    简单明了判断浏览器Firefox:typeof navigator !== 'undefined' && navigator.userAgent.toLowerCase().index ...

  5. 关于在项目中使用spring data redis与jedis的选择

    项目中需要用到redis,主要用来作为缓存,redis的客户端有两种实现方式,一是可以直接调用jedis来实现,二是可以使用spring data redis,通过spring的封装来调用. 应该使用 ...

  6. Tablacus Explorer双心封装版

    Tablacus Explorer双心封装版 http://cloud.189.cn/t/mYj67j7r2Afq (TablacusExplorer17.3.27双心封装版.exe) http:// ...

  7. Windows系统下安装zip命令

    从GnuWin32 项目页面 上下载并安装 zip 命令 添加环境变量到系统中,即将安装目录添加至你的系统的 Path环境变量中( 假设安装目录时D:\Program Files (x86)\GnuW ...

  8. 前端应该掌握的web基础和网络知识

    * 关于HTTP协议 http协议是www服务器和用户请求代理之间通过应答模式来传输超文本内容的一种协议,它是基于请求与响应.无状态.应用层的一种协议.大多数的web应用都建立 在http协议的基础之 ...

  9. PAT 乙级 1046 划拳(15) C++版

    1046. 划拳(15) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 划拳是古老中国酒文化的一个有趣的组成部分 ...

  10. mysql 锁2

    官网地址 https://dev.mysql.com/doc/refman/5.5/en/innodb-transaction-isolation-levels.html 这里主要是说事务隔离级别,以 ...