来源:KDD 2018
原文:HEER
注: 若有错误,欢迎指正
 
这篇KDD’18的文章,没有按照常规的方法将所有的node嵌入到同一的空间,因为文章提出 node 因为连接的 edge 类型(type)不同,存在不兼容(incompatibility)的特性,所以最好能够根据不同的edge type来定义不同度量空间(metric space),保持同一个度量空间下,node的兼容性。
 

1. Abstract

在本文中,作者认为异构信息网络(HIN)中隐含着丰富信息的同时也引入了潜在的不兼容性,为了保留HIN中丰富但可能不兼容的信息,提出对HIN的综合转录问题。还需要提供一种易于使用的方法来有效利用 HIN 中的信息。本文提出HEER方法: 通过对 HIN 的边缘表示,与正确学习的异构度量相结合。

2. Introduction

网络嵌入学习节点的低维表示可以在原始网络中编码其语义信息,且容易和机器学习等方法相结合,可用于分类、链路预测。近来,研究人员证明了HIN 嵌入在作者识别等方面的有效性。
图 1 Network Embedding
 
HIN 异构性不仅包含丰富的信息,还有潜在的不兼容的语义。传统的同构网络嵌入不论其类型,均等的处理所有节点和边,不会捕捉 HIN 的异质性。
如图1,stan,musical,Ang Lee是不同类型的节点,因为musical和Ang Lee的embedding距离很远,会导致stan无法同时和两个embedding同时很近,因此需要学习两个不同的度量空间,从而stan分别在两个度量空间中与对应的node距离很近。
 
图 2 异质网络嵌入学习中的不兼容现象
 
为解决该问题,本文在计算相似度 s 时提出度量向量 μ
该度量向量μ是对不同类型的关系来进行embedding,g_{uv}是表示u,v之间的边的embedding。通过定义该相似度函数,能够获得基于不同边类型r的相似度
 

3. 嵌入 HINs 的边缘表示(HEER)

3.1. 方法思想

通过边缘表示和耦合度量的可用性,得到反应边的存在和类型的损失函数,通过最小化损失,同时更新节点嵌入、边缘嵌入和异构度量,保持输入HIN中的异质性。对不同的不兼容程度建模,其中两个边缘类型越相似,对应的指标越相似。
  • 综合转录 HIN 中的嵌入信息
  • 解决 HINs 中的语义不兼容
  • 利用边缘表示和异质矩阵
  • 使用神经网络学习节点和边的嵌入表示

3.2. 框架结构

图 3 HEER模型框架结构
 

HIN Embedding 定义

  • 输入一个异质网络
           
  • 通过F网络学习出node embedding
           
  • 之后通过g函数来学习出边的embedding
    • 一对节点间可能有多种类型的边,g(u,v) 包含此类关系
            
  • 通过type之间的相似度,也就是定义的相似度函数和原始连接关系共同作为ground truth
  • 最后训练出网络参数,从而能够学到网络的嵌入模型

类型接近度

对于每对节点(u,v)的边缘嵌入 guv
μr 为特定类型嵌入表示,兼容的边类型共享相似的 μ

目标函数

( KL 测量元权重和从嵌入表示得到的相似度间的差异)
将(1)代入(2)考虑所有的边类型,得到
 

4. Experiment

 
 
 
(边缘剔除率为0.4时)

5. 总结

  • HEER模型,能够建立异构网络中不同type之间的不兼容性,这是一种新的尝试,将不兼容的性质提出并通过不同度量空间来表示。
  • HEER模型能够同时学习网络中节点的node embedding和边的edge embedding。
局限性
  • 没有考虑更复杂的网络结构信息,而是仅仅通过相邻节点的关系来确定embedding,更复杂的关系可以通过meta-path来找到,这也可能成为该论文未来的研究方向。

参考:

KDD'18|异质信息网络嵌入学习

HEER-Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks的更多相关文章

  1. [论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks

    [论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问 ...

  2. 最新小样本学习综述 A Survey on Few-Shot Learning | 四大模型Multitask Learning、Embedding Learning、External Memory…

    目录 原文链接: 小样本学习与智能前沿 01 Multitask Learning 01.1 Parameter Sharing 01.2 Parameter Tying. 02 Embedding ...

  3. 论文解读(GraRep)《GraRep: Learning Graph Representations with Global Structural Information》

    论文题目:<GraRep: Learning Graph Representations with Global Structural Information>发表时间:  CIKM论文作 ...

  4. 论文阅读:Relation Structure-Aware Heterogeneous Information Network Embedding

    Relation Structure-Aware Heterogeneous Information Network Embedding(RHINE) (AAAI 2019) 本文结构 (1) 解决问 ...

  5. 论文解读( N2N)《Node Representation Learning in Graph via Node-to-Neighbourhood Mutual Information Maximization》

    论文信息 论文标题:Node Representation Learning in Graph via Node-to-Neighbourhood Mutual Information Maximiz ...

  6. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks) —— 3.Programming Assignments: Deep Neural Network - Application

    Deep Neural Network - Application Congratulations! Welcome to the fourth programming exercise of the ...

  7. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks)——2.Programming Assignments: Building your Deep Neural Network: Step by Step

    Building your Deep Neural Network: Step by Step Welcome to your third programming exercise of the de ...

  8. 课程一(Neural Networks and Deep Learning),第四周(Deep Neural Networks)—— 0.学习目标

    Understand the key computations underlying deep learning, use them to build and train deep neural ne ...

  9. (原创)Stanford Machine Learning (by Andrew NG) --- (week 4) Neural Networks Representation

    Andrew NG的Machine learning课程地址为:https://www.coursera.org/course/ml 神经网络一直被认为是比较难懂的问题,NG将神经网络部分的课程分为了 ...

随机推荐

  1. [LouguT30212]玩游戏

    题面在这里 description 对于\(k=1,2,...,t\),求\[\frac{1}{nm}\sum_{i=1}^{n}\sum_{j=1}^{m}(a_i+b_j)^k\] 对\(9982 ...

  2. 【以前的空间】bzoj1009 [HNOI2008]GT考试

    动态规划+kmp+矩阵快速幂 关于这题可以写出一个dp方程(f[i,j]表示准考证前i位中后j位为不吉利的数字的前j位的情况的个数) f[i,j]=Σf[i-1,k],其中j表示不吉利数字前k个数字加 ...

  3. POJ2142:The Balance——题解

    http://poj.org/problem?id=2142 题目大意:有一天平和两种数量无限的砝码(重为a和b),天平左右都可以放砝码,称质量为c的物品,要求:放置的砝码数量尽量少:当砝码数量相同时 ...

  4. POJ3498:March of the Penguins——题解

    最近的题解的故事背景割. 题目: 描述 在靠近南极的某处,一些企鹅站在许多漂浮的冰块上.由于企鹅是群居动物,所以它们想要聚集到一起,在同一个冰块上.企鹅们不想把自己的身体弄湿,所以它们在冰块之间跳跃, ...

  5. BZOJ2875 & 洛谷2044:[NOI2012]随机数生成器——题解

    https://www.lydsy.com/JudgeOnline/problem.php?id=2875 https://www.luogu.org/problemnew/show/P2044 栋栋 ...

  6. 高效率JavaScript代码的编写技巧

    使用DocumentFragment优化多次append 添加多个dom元素时,先将元素append到DocumentFragment中,最后统一将DocumentFragment添加到页面.该做法可 ...

  7. Python数据处理和数据可视化

    工具1:numpy 下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 入门文档:https://docs.scipy.org/doc/nump ...

  8. A星寻路算法-Mind&Hand(C++)

    //注1:Mind & Hand,MIT校训,这里指的理解与实现(动脑也动手) //注2:博文分为两部分:(1)理解部分,为参考其他优秀博文的摘要梳理:(2)代码部分,是C++代码实现的,源码 ...

  9. 多条select语句的合并

    select (') , (') , (select max(ssq) from DW_MARK_FXJS.F_GS_YCXJJDCSY@new_zgxt ) from dual 这样就不用傻傻的执行 ...

  10. [Luogu 2590] ZJOI2008 树的统计

    [Luogu 2590] ZJOI2008 树的统计 裸树剖不解释. 比板子还简单. #include <algorithm> #include <cstdio> #inclu ...