来源:KDD 2018
原文:HEER
注: 若有错误,欢迎指正
 
这篇KDD’18的文章,没有按照常规的方法将所有的node嵌入到同一的空间,因为文章提出 node 因为连接的 edge 类型(type)不同,存在不兼容(incompatibility)的特性,所以最好能够根据不同的edge type来定义不同度量空间(metric space),保持同一个度量空间下,node的兼容性。
 

1. Abstract

在本文中,作者认为异构信息网络(HIN)中隐含着丰富信息的同时也引入了潜在的不兼容性,为了保留HIN中丰富但可能不兼容的信息,提出对HIN的综合转录问题。还需要提供一种易于使用的方法来有效利用 HIN 中的信息。本文提出HEER方法: 通过对 HIN 的边缘表示,与正确学习的异构度量相结合。

2. Introduction

网络嵌入学习节点的低维表示可以在原始网络中编码其语义信息,且容易和机器学习等方法相结合,可用于分类、链路预测。近来,研究人员证明了HIN 嵌入在作者识别等方面的有效性。
图 1 Network Embedding
 
HIN 异构性不仅包含丰富的信息,还有潜在的不兼容的语义。传统的同构网络嵌入不论其类型,均等的处理所有节点和边,不会捕捉 HIN 的异质性。
如图1,stan,musical,Ang Lee是不同类型的节点,因为musical和Ang Lee的embedding距离很远,会导致stan无法同时和两个embedding同时很近,因此需要学习两个不同的度量空间,从而stan分别在两个度量空间中与对应的node距离很近。
 
图 2 异质网络嵌入学习中的不兼容现象
 
为解决该问题,本文在计算相似度 s 时提出度量向量 μ
该度量向量μ是对不同类型的关系来进行embedding,g_{uv}是表示u,v之间的边的embedding。通过定义该相似度函数,能够获得基于不同边类型r的相似度
 

3. 嵌入 HINs 的边缘表示(HEER)

3.1. 方法思想

通过边缘表示和耦合度量的可用性,得到反应边的存在和类型的损失函数,通过最小化损失,同时更新节点嵌入、边缘嵌入和异构度量,保持输入HIN中的异质性。对不同的不兼容程度建模,其中两个边缘类型越相似,对应的指标越相似。
  • 综合转录 HIN 中的嵌入信息
  • 解决 HINs 中的语义不兼容
  • 利用边缘表示和异质矩阵
  • 使用神经网络学习节点和边的嵌入表示

3.2. 框架结构

图 3 HEER模型框架结构
 

HIN Embedding 定义

  • 输入一个异质网络
           
  • 通过F网络学习出node embedding
           
  • 之后通过g函数来学习出边的embedding
    • 一对节点间可能有多种类型的边,g(u,v) 包含此类关系
            
  • 通过type之间的相似度,也就是定义的相似度函数和原始连接关系共同作为ground truth
  • 最后训练出网络参数,从而能够学到网络的嵌入模型

类型接近度

对于每对节点(u,v)的边缘嵌入 guv
μr 为特定类型嵌入表示,兼容的边类型共享相似的 μ

目标函数

( KL 测量元权重和从嵌入表示得到的相似度间的差异)
将(1)代入(2)考虑所有的边类型,得到
 

4. Experiment

 
 
 
(边缘剔除率为0.4时)

5. 总结

  • HEER模型,能够建立异构网络中不同type之间的不兼容性,这是一种新的尝试,将不兼容的性质提出并通过不同度量空间来表示。
  • HEER模型能够同时学习网络中节点的node embedding和边的edge embedding。
局限性
  • 没有考虑更复杂的网络结构信息,而是仅仅通过相邻节点的关系来确定embedding,更复杂的关系可以通过meta-path来找到,这也可能成为该论文未来的研究方向。

参考:

KDD'18|异质信息网络嵌入学习

HEER-Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks的更多相关文章

  1. [论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks

    [论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问 ...

  2. 最新小样本学习综述 A Survey on Few-Shot Learning | 四大模型Multitask Learning、Embedding Learning、External Memory…

    目录 原文链接: 小样本学习与智能前沿 01 Multitask Learning 01.1 Parameter Sharing 01.2 Parameter Tying. 02 Embedding ...

  3. 论文解读(GraRep)《GraRep: Learning Graph Representations with Global Structural Information》

    论文题目:<GraRep: Learning Graph Representations with Global Structural Information>发表时间:  CIKM论文作 ...

  4. 论文阅读:Relation Structure-Aware Heterogeneous Information Network Embedding

    Relation Structure-Aware Heterogeneous Information Network Embedding(RHINE) (AAAI 2019) 本文结构 (1) 解决问 ...

  5. 论文解读( N2N)《Node Representation Learning in Graph via Node-to-Neighbourhood Mutual Information Maximization》

    论文信息 论文标题:Node Representation Learning in Graph via Node-to-Neighbourhood Mutual Information Maximiz ...

  6. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks) —— 3.Programming Assignments: Deep Neural Network - Application

    Deep Neural Network - Application Congratulations! Welcome to the fourth programming exercise of the ...

  7. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks)——2.Programming Assignments: Building your Deep Neural Network: Step by Step

    Building your Deep Neural Network: Step by Step Welcome to your third programming exercise of the de ...

  8. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks)—— 0.学习目标

    Understand the key computations underlying deep learning, use them to build and train deep neural ne ...

  9. (原创)Stanford Machine Learning (by Andrew NG) --- (week 4) Neural Networks Representation

    Andrew NG的Machine learning课程地址为:https://www.coursera.org/course/ml 神经网络一直被认为是比较难懂的问题,NG将神经网络部分的课程分为了 ...

随机推荐

  1. [SDOI2014][BZOJ3533] 向量集 [线段树+凸包]

    题面 BZOJ传送门 思路 首先当然是推式子 对于一个询问点$(x_0,y_0$和给定向量$(x_1,y_1)$来说,点积这么表达: $A=x_0x_1+y_0y_1$ 首先肯定是考虑大小关系:$x_ ...

  2. BZOJ1086:[SCOI2005]王室联邦——题解

    http://www.lydsy.com/JudgeOnline/problem.php?id=1086 题面源于洛谷. 题目描述 “余”人国的国王想重新编制他的国家.他想把他的国家划分成若干个省,每 ...

  3. HDU3949:XOR——题解

    http://acm.hdu.edu.cn/showproblem.php?pid=3949 求n个数的异或和第k小. 参考:https://blog.sengxian.com/algorithms/ ...

  4. 洛谷 P3332 [ZJOI2013]K大数查询 解题报告

    P3332 [ZJOI2013]K大数查询 题目描述 有\(N\)个位置,\(M\)个操作.操作有两种,每次操作如果是\(\tt{1\ a\ b\ c}\)的形式表示在第\(a\)个位置到第\(b\) ...

  5. 洛谷 P2747 [USACO5.4]周游加拿大Canada Tour 解题报告

    P2747 [USACO5.4]周游加拿大Canada Tour 题目描述 你赢得了一场航空公司举办的比赛,奖品是一张加拿大环游机票.旅行在这家航空公司开放的最西边的城市开始,然后一直自西向东旅行,直 ...

  6. Codeforces Round #401 (Div. 2) A B C 水 贪心 dp

    A. Shell Game time limit per test 0.5 seconds memory limit per test 256 megabytes input standard inp ...

  7. HDU 2136 素数打表+求质数因子

    Largest prime factor Time Limit: 5000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Oth ...

  8. 在linux下创建软链接(即目录映射)

    在linux中创建软链接,使用命令:ln -s. 语法:ln -s 源文件 目标文件.

  9. 51nod 1873 高精度计算

    JAVA BigDecimal import java.util.*; import java.math.*; public class Main { public static void main( ...

  10. 【LibreOJ】#538. 「LibreOJ NOIP Round #1」数列递推

    [题意]LibreOJ [算法]乱搞 [题解]容易发现数列最后一定单调,最后单调递增则最大值赋为最后一个,反之最小值赋为最后一个,然后处理一些细节就可以AC,要注意以下几点: 1.数列连续三项以及数列 ...