[论文阅读笔记] node2vec Scalable Feature Learning for Networks

沁泽 2024-10-19 03:41:04 原文

[论文阅读笔记] node2vec：Scalable Feature Learning for Networks

本文结构

解决问题
主要贡献
算法原理
参考文献

(1) 解决问题

由于DeepWalk的随机游走是完全无指导的随机采样，即随机游走不可控。本文从该问题出发，设计了一种有偏向的随机游走策略，使得随机游走可以在DFS和BFS两种极端搜索方式中取得平衡。

(2) 主要贡献

Contribution： 本篇论文主要的创新点在于改进了随机游走的策略，定义了两个参数p和q，使得随机游走在BFS和DFS两种极端中达到一个平衡，同时考虑到局部和宏观的信息。

(3) 算法原理

node2vec算法框架主要包含两个部分：首先在图上做有偏向的随机游走，其次将得到的节点序列输入Skip-Gram模型学习节点表示向量嵌入(不再赘述，参考DeepWalk）。

有偏的随机游走策略：

其定义了两个参数p（向后参数）和q（向前参数），在广度优先搜索（BFS）和深度优先搜索（DFS）两种极端中达到一个平衡，从而同时考虑到局部和全局的结构信息。给定源点u，利用有偏随机游走生成长度为L的序列，随机游走的转移概率计算公式设计如下：

c_i表示序列中的第i个点，c₀=u，Z为一个归一化常数。分母π_vx为v到x的非归一化的转移概率，如下所示（d_tx为上一跳节点t与下一跳考虑跳转节点的距离）：

以一个例子来解释，如下图所示：

假设随机游走的上一跳节点是t，当前节点是v，则依据上述转移概率公式的设计下一跳节点怎么选择呢？下一跳节点可能是x₁，x₂，x₃和t。由于x₁与上一跳节点距离1跳，因此下一跳到节点x₁的非归一化转移概率为1，而x₂、x₃与上一跳节点距离2跳，因此下一跳到x₂和x₃的非归一化转移概率均为1/q，此外t与上一跳节点距离0跳，因此下一跳到t的非归一化转移概率为1/p。以上便是Node2vec中设计的权衡BFS和DFS的随机游走策略。

通过以上方式生成同构网络上的随机游走序列之后，采用Skip-Gram模型训练节点向量即可。

(4) 参考文献

Grover A, Leskovec J. node2vec: Scalable feature learning for networks[A]. Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining[C]. 2016: 855–864.

[论文阅读笔记] node2vec Scalable Feature Learning for Networks的更多相关文章

[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks
[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks 本文结构解决问题主要贡献算法 ...
论文解读（node2vec）《node2vec Scalable Feature Learning for Networks》
论文题目:<node2vec Scalable Feature Learning for Network>发表时间: KDD 2016 论文作者: Aditya Grover;Adit ...
论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
[论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding
[论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding 本文结构解决问题主要贡献算法原理实验结果参考文献 ...
论文阅读笔记二十三：Learning to Segment Instances in Videos with Spatial Propagation Network（CVPR2017）
论文源址:https://arxiv.org/abs/1709.04609 摘要该文提出了基于深度学习的实例分割框架,主要分为三步,(1)训练一个基于ResNet-101的通用模型,用于分割图像中的 ...
论文阅读笔记十九：PIXEL DECONVOLUTIONAL NETWORKS(CVPR2017)
论文源址:https://arxiv.org/abs/1705.06820 tensorflow(github): https://github.com/HongyangGao/PixelDCN 基于 ...
[论文阅读笔记] LouvainNE Hierarchical Louvain Method for High Quality and Scalable Network Embedding
[论文阅读笔记] LouvainNE: Hierarchical Louvain Method for High Quality and Scalable Network Embedding 本文结构 ...
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问 ...
[置顶] 人工智能（深度学习）加速芯片论文阅读笔记（已添加ISSCC17，FPGA17...ISCA17...）
这是一个导读,可以快速找到我记录的关于人工智能(深度学习)加速芯片论文阅读笔记. ISSCC 2017 Session14 Deep Learning Processors: ISSCC 2017关于 ...

随机推荐

jdk源码之 hashmap 与hashtable 的区别
hashmap hashtable 线程安全否,但jdk5之后,提供ConcurrentHashMap,可替代HashTable. 是,synchronized value是否允许为空是否 ...
1、pytorch写的第一个Linear模型（原始版，不调用nn.Modules模块）
参考: https://github.com/Iallen520/lhy_DL_Hw/blob/master/PyTorch_Introduction.ipynb 模拟一个回归模型,y = X * w ...
Day1-7【Scrum 冲刺博客集合】
Day1-Day7博客链接 Day1[Scrum 冲刺博客] Day2[Scrum 冲刺博客] Day3[Scrum 冲刺博客] Day4[Scrum 冲刺博客] Day5[Scrum 冲刺博客] D ...
两种方式简单免杀ew
1.资源操作法使用工具: Restorator 2018 BeCyIconGrabber 首先我们从github下载ew使用360进行查杀打开Restorator 将ew拖入,右键添加资源选择图 ...
idea2020.2.x/2020.3.x最新破解版方法教程无限永久重置插件激活码
idea是一个java开发工件,相信我所有的朋友都用过.本教程教你做到完美,安全,永久.破解 idea2020.2.x和idea2020.3.x的所有版本绝对是100% 激活,支持Windows Ma ...
AcWing 204. 表达整数的奇怪方式 / Strange Way To Express Integers
我作为一个初中蒟蒻,听y大视频听了5遍还不懂,快哭了.然后终于(好像)搞懂,写成题解加深一下记忆... 将式子等价转换对于每两个式子(我们考虑将其合并): \(x \equiv a_1 \%\ m_ ...
Nginx(一)：安装与常用命令
简介 Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器,特点是占有内存少,并发能力强,事实上nginx的并发能力确实在同类型的网页服务器中表现 ...
OkHttpClient调优案例
OkHttpClient调优案例作者:Grey 原文地址: 语雀博客园 Github 实际案例系统运行一段时间后,线程数量飙升,CPU持续居高不下排查工具 https://fastthread ...
js下 Day11、案例
一．成绩分类效果图: 功能思路分析: 1. 渲染数据 2. 鼠标按下开启拖拽 \1. 给成绩盒子绑定鼠标按下事件(mousedown),用事件委托做多个标签的拖拽 \2. 开启控制拖拽的变量 \3. ...
[日常摸鱼]bzoj3083遥远的国度-树链剖分
一无聊就找树剖写题意:一颗带点权的树,三种操作:1.换根 2.链赋值 3.查询子树最小值如果没有换根的话直接就是裸的树剖了,对于换根的操作我们可以分类讨论. 1.如果查询的$x$就是根,那答案就是 ...