摘要:本文是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。

本文分享自华为云社区《CIKM'21 PeriodicMove论文解读》,作者:云数据库创新Lab。

导读

本文(PeriodicMove: shift-aware human mobility recovery with graph neural network)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。CIKM是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到投稿1251篇,其中录用论文271篇,录取率约为21.7% 。该论文是云数据库创新LAB在轨迹分析层面取得的关键技术成果之一。

1 摘要

随着各种基于位置的服务的推出,将稀疏的人类移动轨迹数据进行恢复补全以提升这些下游任务的准确率显得尤为重要。然而人类移动轨迹数据的恢复面临着较大的挑战:

  • 轨迹中轨迹点之间具有复杂的转移模式
  • 人类移动轨迹数据中普遍存在多层次周期性以及周期偏移现象
  • 现目前采集的轨迹数据是相对稀疏的

在本文中,我们提出了一个名为PeriodicMove的基于图神经网络的人类行为轨迹恢复模型,在该模型中,我们首先对每条历史轨迹构建有向图,并使用图神经网络捕捉位置之间的复杂转移模式;之后,我们设计了两个注意力机制分别捕捉人类行为轨迹的多层次周期性与周期偏移性;最后,我们设计了一个空间感知的损失函数来将位置的空间临近信息引入到模型中,从而一定程度上缓解了数据稀疏问题。我们在两个具有代表性的人类轨迹数据集上做了大量实验,实验结果表明,我们的模型PeriodicMove相对于目前SOTA模型获得了2.9%-9%的大幅性能提升。

2 模型

2.1 模型架构

我们的模型主要包括五个部分:图神经网络层、时序嵌入层、两个注意力机制层以及最后的融合恢复层

2.2 图神经网络层

为了捕捉轨迹中轨迹点之间复杂的空间转移关系,我们首先将每条轨迹按照如图所示方式进行建图,然后利用图神经网络来学习有向图中轨迹节点之间复杂的空间转移模式

2.3 时序嵌入层

我们采用《Attention is all you need》中提到的利用三角函数中相对相位来刻画轨迹序列中的相对顺序关系,然后我们将图神经网络层以及时序嵌入层的结果拼接起来,形成包含复杂时空依赖关系的嵌入向量表示

2.4 注意力机制层

Cross Attention Layer主要用于解决人类移动轨迹数据中的周期偏移现象,我们将当前时刻t的移动模式与每一条历史轨迹中所有时刻的移动模式进行比较,基于一个相似性权重将相关的历史信息聚合在历史轨迹的t时刻以解决周期偏移现象

在经过Cross Attention Layer后,每一条历史轨迹的每个时刻的轨迹点表示可以理解为根据当前待补全轨迹的每个时刻进行了偏移校准。接下来在Soft Attention Layer中,我们将当前轨迹的第t时刻与每一条历史轨迹的第t时刻的轨迹表示进行一个attention操作,形成一个包含历史轨迹中的多层次周期性的历史轨迹表示

2.5 融合恢复层

在最后的融合恢复层,我们利用包含复杂时空依赖关系、包含多层次周期性且克服了周期偏移现象的历史轨迹增强序列辅助当前轨迹来进行最后的补全恢复

2.6 设计Distance Loss

在轨迹数据高度稀疏的场景下,交叉熵损失不能很好地捕捉空间邻近性,而空间邻近性是人类移动恢复的重要特征。因此,我们设计了一个距离损失函数,以纳入空间邻近信息的模型,并且采用了 Noise Contrastive Estimation (NCE)来加速模型的训练,可视化结果显示,加入了Distance Loss能够有效帮助模型捕捉空间邻近信息

3 实验

3.1 实验结果

我们的模型PeriodicMove相对于目前SOTA模型(2021-AAAI)获得了2.9%-9%的大幅性能提升

3.2 消融实验

我们对模型五个部分分别进行了消融实验,从实验结果中可以看出每个模块对于我们的任务都有一定的贡献,其中Soft Attention Layer模块去掉后,模型效果下降最快,说明人类移动轨迹数据恢复任务中多层次周期性起着非常大的作用

3.3 鲁棒性实验

我们将本模型与最新的SOTA模型(2021-AAAI)进行一个在不同缺失率下的鲁棒性实验,从实验结果中可以看出,两个模型都具有较好的鲁棒性,但是我们的模型在各个缺失率下的效果都在AttnMove上有一定的提升

4 应用

在各种基于位置的服务中如:个性化地理位置推荐、城市智能交通调度以及轨迹异常检测等诸多场景,只要是收集到的轨迹数据是稀疏的都会影响这些下游任务的准确率。我们论文的目的是将稀疏的轨迹数据恢复成稠密且精细的轨迹数据,以提高这些下游任务的准确率

华为云数据库创新lab官网:https://www.huaweicloud.com/lab/clouddb/home.html

点击关注,第一时间了解华为云新鲜技术~

顶会CIKM'21论文解读:基于图神经网络的人类行为轨迹恢复模型的更多相关文章

  1. PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]

    PGL图学习之图神经网络ERNIESage.UniMP进阶模型[系列八] 原项目链接:fork一下即可:https://aistudio.baidu.com/aistudio/projectdetai ...

  2. 图神经网络之预训练大模型结合:ERNIESage在链接预测任务应用

    1.ERNIESage运行实例介绍(1.8x版本) 本项目原链接:https://aistudio.baidu.com/aistudio/projectdetail/5097085?contribut ...

  3. 知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-KG4SL:用于人类癌症综合致死率预测的知识图神经网络

    5.(2021.7.12)Bioinformatics-KG4SL:用于人类癌症综合致死率预测的知识图神经网络 论文标题:KG4SL: knowledge graph neural network f ...

  4. zz【清华NLP】图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐

    [清华NLP]图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐 图神经网络研究成为当前深度学习领域的热点.最近,清华大学NLP课题组Jie Zhou, Ganqu Cui, Zhengy ...

  5. NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

    NLP知识图谱项目合集(信息抽取.文本分类.图神经网络.性能优化等) 这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习. 1. 信息抽取项目合集 1.PaddleN ...

  6. CIKM 18 | 蚂蚁金服论文:基于异构图神经网络的恶意账户识别方法

    小蚂蚁说: ACM CIKM 2018 全称是 The 27th ACM International Conference on Information and Knowledge Managemen ...

  7. 论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)

    摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...

  8. 解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法

    摘要:本文提出了两个用于无监督的具备可解释性和鲁棒性时间序列离群点检测的自动编码器框架. 本文分享自华为云社区<解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法&g ...

  9. AAAI2019 | 基于区域分解集成的目标检测 论文解读

    Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测 论文解读 作者 | 文永亮 学 ...

  10. 论文阅读: CCF A 2022 MVD: 基于流敏感图神经网络的内存相关漏洞检测 (ICSE)

    Motivation: 内存相关漏洞会导致性能下降和程序崩溃,严重威胁到现代软件的安全性. 静态分析方法使用一些预定义的漏洞规则或模式来搜索不正确的内存操作,然而,定义良好的漏洞规则或模式高度依赖于专 ...

随机推荐

  1. Django + celery + redis 执行异步任务及查看结果

      官方文档 https://docs.celeryproject.org/en/latest/django/first-steps-with-django.html#using-celery-wit ...

  2. win10如何美化cmd[添加新字体+配色方案+窗口栏样式]

    最近学mysql的时候用到很多cmd操作,但是cmd那默认界面实在是丑到没朋友.在网上收集了些资料最后把cmd美化成这样: 修改方法: 1.修改字体,新建一个txt文件,里面粘贴以下代码: Windo ...

  3. STL容器详解

    详细总结STL 为什么C++比C更受人欢迎呢?除了C++ 的编译令人感到更舒适,C++的标准模板库(STL)也占了很重要的原因.当你还在用手手写快排.手写二叉堆,挑了半天挑不出毛病的时候,C++党一手 ...

  4. .NET 8 Video教程介绍(开篇)

    教程简介 本文将简单描述视频网站教程,视频网站是一个类似于腾讯视频一样的网站,视频资源用户自己上传,然后提供友好的界面查看视频和搜索视频,并且提供管理页面对于视频进行管理,我们将使用Blazor作为前 ...

  5. 如何使用Tampermonkey开发并使用一个浏览器脚本

    准备工作 简介 Tampermonkey 是一款强大的浏览器扩展,它允许您定制网页的行为,改变和优化网页的展示方式或者功能以满足个人需求.通过编写自定义脚本,您可以实现许多有趣的功能,从自动化任务到改 ...

  6. 洛谷5789 [TJOI2017]可乐(矩阵快速幂,Floyd思想)

    题意:可乐机器人有三种行为: 停在原地,去下一个相邻的城市,自爆.它每一秒都会随机触发一种行为.现在给加里敦星球城市图,在第 0秒时可乐机器人在 1号城市,问经过了 t秒,可乐机器人的行为方案数是多少 ...

  7. 现代统计分析软件Datainside在学生成绩分析中的应用

    Datainside(薪火数据)是一款非常常用的统计分析软件,广泛应用于学术研究和商业领域. 在学生成绩分析方面,Datainside提供了丰富的功能和工具,可以帮助教育机构和研究人员深入理解学生的学 ...

  8. Socket是什么/怎么理解Socket

    Socket 先来看一下百度百科对于Socket的介绍:套接字(socket)是一个抽象层,应用程序可以通过它发送或接收数据,可对其进行像对文件一样的打开.读写和关闭等操作.套接字允许应用程序将I/O ...

  9. [HAOI2018] 字串覆盖

    [HAOI2018]字串覆盖 题目描述 小C对字符串颇有研究,他觉得传统的字符串匹配太无聊了,于是他想到了这 样一个问题. 对于两个长度为n的串A, B, 小C每次会给出给出4个参数s, t, l, ...

  10. 解决OpenCV编译时./bin: error while loading shared libraries: libopencv_highgui.so.3.2: cannot open的问题

    1.问题 安装好了opencv后,用其去检测是否可以使用时,出现了如下的问题: 2.解决 参考这篇博文点击 的配置环境即可解决