顶会CIKM'21论文解读:基于图神经网络的人类行为轨迹恢复模型
摘要:本文是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。
本文分享自华为云社区《CIKM'21 PeriodicMove论文解读》,作者:云数据库创新Lab。
导读
本文(PeriodicMove: shift-aware human mobility recovery with graph neural network)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。CIKM是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到投稿1251篇,其中录用论文271篇,录取率约为21.7% 。该论文是云数据库创新LAB在轨迹分析层面取得的关键技术成果之一。
1 摘要
随着各种基于位置的服务的推出,将稀疏的人类移动轨迹数据进行恢复补全以提升这些下游任务的准确率显得尤为重要。然而人类移动轨迹数据的恢复面临着较大的挑战:
- 轨迹中轨迹点之间具有复杂的转移模式
- 人类移动轨迹数据中普遍存在多层次周期性以及周期偏移现象
- 现目前采集的轨迹数据是相对稀疏的
在本文中,我们提出了一个名为PeriodicMove的基于图神经网络的人类行为轨迹恢复模型,在该模型中,我们首先对每条历史轨迹构建有向图,并使用图神经网络捕捉位置之间的复杂转移模式;之后,我们设计了两个注意力机制分别捕捉人类行为轨迹的多层次周期性与周期偏移性;最后,我们设计了一个空间感知的损失函数来将位置的空间临近信息引入到模型中,从而一定程度上缓解了数据稀疏问题。我们在两个具有代表性的人类轨迹数据集上做了大量实验,实验结果表明,我们的模型PeriodicMove相对于目前SOTA模型获得了2.9%-9%的大幅性能提升。
2 模型
2.1 模型架构

我们的模型主要包括五个部分:图神经网络层、时序嵌入层、两个注意力机制层以及最后的融合恢复层
2.2 图神经网络层

为了捕捉轨迹中轨迹点之间复杂的空间转移关系,我们首先将每条轨迹按照如图所示方式进行建图,然后利用图神经网络来学习有向图中轨迹节点之间复杂的空间转移模式
2.3 时序嵌入层


我们采用《Attention is all you need》中提到的利用三角函数中相对相位来刻画轨迹序列中的相对顺序关系,然后我们将图神经网络层以及时序嵌入层的结果拼接起来,形成包含复杂时空依赖关系的嵌入向量表示
2.4 注意力机制层

Cross Attention Layer主要用于解决人类移动轨迹数据中的周期偏移现象,我们将当前时刻t的移动模式与每一条历史轨迹中所有时刻的移动模式进行比较,基于一个相似性权重将相关的历史信息聚合在历史轨迹的t时刻以解决周期偏移现象

在经过Cross Attention Layer后,每一条历史轨迹的每个时刻的轨迹点表示可以理解为根据当前待补全轨迹的每个时刻进行了偏移校准。接下来在Soft Attention Layer中,我们将当前轨迹的第t时刻与每一条历史轨迹的第t时刻的轨迹表示进行一个attention操作,形成一个包含历史轨迹中的多层次周期性的历史轨迹表示
2.5 融合恢复层

在最后的融合恢复层,我们利用包含复杂时空依赖关系、包含多层次周期性且克服了周期偏移现象的历史轨迹增强序列辅助当前轨迹来进行最后的补全恢复
2.6 设计Distance Loss

在轨迹数据高度稀疏的场景下,交叉熵损失不能很好地捕捉空间邻近性,而空间邻近性是人类移动恢复的重要特征。因此,我们设计了一个距离损失函数,以纳入空间邻近信息的模型,并且采用了 Noise Contrastive Estimation (NCE)来加速模型的训练,可视化结果显示,加入了Distance Loss能够有效帮助模型捕捉空间邻近信息
3 实验
3.1 实验结果

我们的模型PeriodicMove相对于目前SOTA模型(2021-AAAI)获得了2.9%-9%的大幅性能提升
3.2 消融实验

我们对模型五个部分分别进行了消融实验,从实验结果中可以看出每个模块对于我们的任务都有一定的贡献,其中Soft Attention Layer模块去掉后,模型效果下降最快,说明人类移动轨迹数据恢复任务中多层次周期性起着非常大的作用
3.3 鲁棒性实验

我们将本模型与最新的SOTA模型(2021-AAAI)进行一个在不同缺失率下的鲁棒性实验,从实验结果中可以看出,两个模型都具有较好的鲁棒性,但是我们的模型在各个缺失率下的效果都在AttnMove上有一定的提升
4 应用

在各种基于位置的服务中如:个性化地理位置推荐、城市智能交通调度以及轨迹异常检测等诸多场景,只要是收集到的轨迹数据是稀疏的都会影响这些下游任务的准确率。我们论文的目的是将稀疏的轨迹数据恢复成稠密且精细的轨迹数据,以提高这些下游任务的准确率
华为云数据库创新lab官网:https://www.huaweicloud.com/lab/clouddb/home.html
顶会CIKM'21论文解读:基于图神经网络的人类行为轨迹恢复模型的更多相关文章
- PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]
PGL图学习之图神经网络ERNIESage.UniMP进阶模型[系列八] 原项目链接:fork一下即可:https://aistudio.baidu.com/aistudio/projectdetai ...
- 图神经网络之预训练大模型结合:ERNIESage在链接预测任务应用
1.ERNIESage运行实例介绍(1.8x版本) 本项目原链接:https://aistudio.baidu.com/aistudio/projectdetail/5097085?contribut ...
- 知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-KG4SL:用于人类癌症综合致死率预测的知识图神经网络
5.(2021.7.12)Bioinformatics-KG4SL:用于人类癌症综合致死率预测的知识图神经网络 论文标题:KG4SL: knowledge graph neural network f ...
- zz【清华NLP】图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐
[清华NLP]图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐 图神经网络研究成为当前深度学习领域的热点.最近,清华大学NLP课题组Jie Zhou, Ganqu Cui, Zhengy ...
- NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)
NLP知识图谱项目合集(信息抽取.文本分类.图神经网络.性能优化等) 这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习. 1. 信息抽取项目合集 1.PaddleN ...
- CIKM 18 | 蚂蚁金服论文:基于异构图神经网络的恶意账户识别方法
小蚂蚁说: ACM CIKM 2018 全称是 The 27th ACM International Conference on Information and Knowledge Managemen ...
- 论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)
摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...
- 解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法
摘要:本文提出了两个用于无监督的具备可解释性和鲁棒性时间序列离群点检测的自动编码器框架. 本文分享自华为云社区<解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法&g ...
- AAAI2019 | 基于区域分解集成的目标检测 论文解读
Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测 论文解读 作者 | 文永亮 学 ...
- 论文阅读: CCF A 2022 MVD: 基于流敏感图神经网络的内存相关漏洞检测 (ICSE)
Motivation: 内存相关漏洞会导致性能下降和程序崩溃,严重威胁到现代软件的安全性. 静态分析方法使用一些预定义的漏洞规则或模式来搜索不正确的内存操作,然而,定义良好的漏洞规则或模式高度依赖于专 ...
随机推荐
- Vue之键盘事件
1.使用keydown触发事件 <!DOCTYPE html> <html lang="en"> <head> <meta charset ...
- SHA256算法加密工具类
代码如下,请自取 /** * @description: SHA256算法加密 * @author: luolei * @Date: 2022-10-31 17:16 */ public class ...
- CSP 2023 游只因
CSP \(2023\) 游只因 前面不写太多. Day \(-\frac{114514}{191}\) 雅礼(HN 四大名校)集训. Day 1:考试,讲题,改题. Day 2:考试,讲题,改题. ...
- 电路中的N.M.缩写含义
国外的一些电路中会发现在一些器件旁会有 N.M. 的标注. N.M. = Not Mount
- 虚拟机centos7上安装docker+jenkins
虚拟机centos7上安装docker+jenkins 学习某册子的CICD时,安装了docker和jenkins,记录的安装过程和中间碰到的问题. 使用的虚拟机为Parallels Desktop, ...
- goto关键词
1.前言 goto,一个蒟蒻一用就废,大佬一用就吊炸天的神奇关键字. 今天,我要来盘它!!! 2.goto只能在函数内实现跳转,不能跨函数跳转 因为标号label是局部有效的. #include &l ...
- 伯俊ERP与金蝶云星空对接集成连通应收单新增
伯俊ERP与金蝶云星空对接集成表头表体组合查询连通应收单新增(应收单-标准应收单(KD应收单销售退) 数据源系统:伯俊ERP 未来,伯俊科技也会砥砺前行,不断为品牌提供更全面的零售终端致胜利器.伯俊科 ...
- 用Python编写 2048 命令行小游戏
本篇博文围绕使用Python开发热门游戏2048 GAME(命令行版本) 代码未做任何优化(原生且随意).全程以面向过程.MVC的设计思想为主.开发环境是Ubuntu系统下的Pycharm 2048是 ...
- three.js 汽车行驶效果
实现原理是使用TWEEN.Tween实现动画效果 实现 汽车模型加载 使用Promise编写模型的异步加载方法 Car.prototype.loadCar = function (position, ...
- Hive select查询语句
创建表 CREATE TABLE t_usa_covid19( count_date string, county string, state string, fips int, cases int, ...