摘要:本文是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。

本文分享自华为云社区《CIKM'21 PeriodicMove论文解读》,作者:云数据库创新Lab。

导读

本文(PeriodicMove: shift-aware human mobility recovery with graph neural network)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。CIKM是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到投稿1251篇,其中录用论文271篇,录取率约为21.7% 。该论文是云数据库创新LAB在轨迹分析层面取得的关键技术成果之一。

1 摘要

随着各种基于位置的服务的推出,将稀疏的人类移动轨迹数据进行恢复补全以提升这些下游任务的准确率显得尤为重要。然而人类移动轨迹数据的恢复面临着较大的挑战:

  • 轨迹中轨迹点之间具有复杂的转移模式
  • 人类移动轨迹数据中普遍存在多层次周期性以及周期偏移现象
  • 现目前采集的轨迹数据是相对稀疏的

在本文中,我们提出了一个名为PeriodicMove的基于图神经网络的人类行为轨迹恢复模型,在该模型中,我们首先对每条历史轨迹构建有向图,并使用图神经网络捕捉位置之间的复杂转移模式;之后,我们设计了两个注意力机制分别捕捉人类行为轨迹的多层次周期性与周期偏移性;最后,我们设计了一个空间感知的损失函数来将位置的空间临近信息引入到模型中,从而一定程度上缓解了数据稀疏问题。我们在两个具有代表性的人类轨迹数据集上做了大量实验,实验结果表明,我们的模型PeriodicMove相对于目前SOTA模型获得了2.9%-9%的大幅性能提升。

2 模型

2.1 模型架构

我们的模型主要包括五个部分:图神经网络层、时序嵌入层、两个注意力机制层以及最后的融合恢复层

2.2 图神经网络层

为了捕捉轨迹中轨迹点之间复杂的空间转移关系,我们首先将每条轨迹按照如图所示方式进行建图,然后利用图神经网络来学习有向图中轨迹节点之间复杂的空间转移模式

2.3 时序嵌入层

我们采用《Attention is all you need》中提到的利用三角函数中相对相位来刻画轨迹序列中的相对顺序关系,然后我们将图神经网络层以及时序嵌入层的结果拼接起来,形成包含复杂时空依赖关系的嵌入向量表示

2.4 注意力机制层

Cross Attention Layer主要用于解决人类移动轨迹数据中的周期偏移现象,我们将当前时刻t的移动模式与每一条历史轨迹中所有时刻的移动模式进行比较,基于一个相似性权重将相关的历史信息聚合在历史轨迹的t时刻以解决周期偏移现象

在经过Cross Attention Layer后,每一条历史轨迹的每个时刻的轨迹点表示可以理解为根据当前待补全轨迹的每个时刻进行了偏移校准。接下来在Soft Attention Layer中,我们将当前轨迹的第t时刻与每一条历史轨迹的第t时刻的轨迹表示进行一个attention操作,形成一个包含历史轨迹中的多层次周期性的历史轨迹表示

2.5 融合恢复层

在最后的融合恢复层,我们利用包含复杂时空依赖关系、包含多层次周期性且克服了周期偏移现象的历史轨迹增强序列辅助当前轨迹来进行最后的补全恢复

2.6 设计Distance Loss

在轨迹数据高度稀疏的场景下,交叉熵损失不能很好地捕捉空间邻近性,而空间邻近性是人类移动恢复的重要特征。因此,我们设计了一个距离损失函数,以纳入空间邻近信息的模型,并且采用了 Noise Contrastive Estimation (NCE)来加速模型的训练,可视化结果显示,加入了Distance Loss能够有效帮助模型捕捉空间邻近信息

3 实验

3.1 实验结果

我们的模型PeriodicMove相对于目前SOTA模型(2021-AAAI)获得了2.9%-9%的大幅性能提升

3.2 消融实验

我们对模型五个部分分别进行了消融实验,从实验结果中可以看出每个模块对于我们的任务都有一定的贡献,其中Soft Attention Layer模块去掉后,模型效果下降最快,说明人类移动轨迹数据恢复任务中多层次周期性起着非常大的作用

3.3 鲁棒性实验

我们将本模型与最新的SOTA模型(2021-AAAI)进行一个在不同缺失率下的鲁棒性实验,从实验结果中可以看出,两个模型都具有较好的鲁棒性,但是我们的模型在各个缺失率下的效果都在AttnMove上有一定的提升

4 应用

在各种基于位置的服务中如:个性化地理位置推荐、城市智能交通调度以及轨迹异常检测等诸多场景,只要是收集到的轨迹数据是稀疏的都会影响这些下游任务的准确率。我们论文的目的是将稀疏的轨迹数据恢复成稠密且精细的轨迹数据,以提高这些下游任务的准确率

华为云数据库创新lab官网:https://www.huaweicloud.com/lab/clouddb/home.html

点击关注,第一时间了解华为云新鲜技术~

顶会CIKM'21论文解读:基于图神经网络的人类行为轨迹恢复模型的更多相关文章

  1. PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]

    PGL图学习之图神经网络ERNIESage.UniMP进阶模型[系列八] 原项目链接:fork一下即可:https://aistudio.baidu.com/aistudio/projectdetai ...

  2. 图神经网络之预训练大模型结合:ERNIESage在链接预测任务应用

    1.ERNIESage运行实例介绍(1.8x版本) 本项目原链接:https://aistudio.baidu.com/aistudio/projectdetail/5097085?contribut ...

  3. 知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-KG4SL:用于人类癌症综合致死率预测的知识图神经网络

    5.(2021.7.12)Bioinformatics-KG4SL:用于人类癌症综合致死率预测的知识图神经网络 论文标题:KG4SL: knowledge graph neural network f ...

  4. zz【清华NLP】图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐

    [清华NLP]图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐 图神经网络研究成为当前深度学习领域的热点.最近,清华大学NLP课题组Jie Zhou, Ganqu Cui, Zhengy ...

  5. NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

    NLP知识图谱项目合集(信息抽取.文本分类.图神经网络.性能优化等) 这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习. 1. 信息抽取项目合集 1.PaddleN ...

  6. CIKM 18 | 蚂蚁金服论文:基于异构图神经网络的恶意账户识别方法

    小蚂蚁说: ACM CIKM 2018 全称是 The 27th ACM International Conference on Information and Knowledge Managemen ...

  7. 论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)

    摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...

  8. 解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法

    摘要:本文提出了两个用于无监督的具备可解释性和鲁棒性时间序列离群点检测的自动编码器框架. 本文分享自华为云社区<解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法&g ...

  9. AAAI2019 | 基于区域分解集成的目标检测 论文解读

    Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测 论文解读 作者 | 文永亮 学 ...

  10. 论文阅读: CCF A 2022 MVD: 基于流敏感图神经网络的内存相关漏洞检测 (ICSE)

    Motivation: 内存相关漏洞会导致性能下降和程序崩溃,严重威胁到现代软件的安全性. 静态分析方法使用一些预定义的漏洞规则或模式来搜索不正确的内存操作,然而,定义良好的漏洞规则或模式高度依赖于专 ...

随机推荐

  1. Java文件与IO流

    首先我们要清楚什么是流,正如其名,很形象,流就是像水一样的东西,具有方向性,在java中 ,流大概就是类 接下来,我们要对输入输出流有一个基本认识,什么是输入输出流呢? 输入输出明显需要一个参照,而这 ...

  2. CF85B [Embassy Queue]

    Problem 题目简述 有 \(n\) 个人分别在 \(c_i\) 的时刻来,他们都要在 \(k_1\),\(k_2\) 和 \(k_3\) 窗口干不同的事,当有后面一人也排在在同一窗口时,必须等待 ...

  3. kubeadm 添加master及node

    1.添加master 新master服务器初始化 添加k8s源 $ cat <<EOF > /etc/yum.repos.d/kubernetes.repo [kubernetes] ...

  4. 比较并交换(compare and swap, CAS)

    比较并交换(compare and swap, CAS),是原子操作的一种,可用于在多线程编程中实现不被打断的数据交换操作,从而避免多线程同时改写某一数据时由于执行顺序不确定性以及中断的不可预知性产生 ...

  5. 请教shell读写XML问题

    请教shell读写XML问题 现有 123.xml文件,内容是:<?xml version="1.0" encoding="GBK"?><vi ...

  6. Electron-Vue中引入vue-devtools

    效果图 先看下我引入后的效果图: 可以看到,跟在Chrome浏览器一样,会在开发者工具中出现一个Vue的标签,使用方式没有差别. 引入步骤 步骤一:下载安装vue-devtools 到vue-devt ...

  7. 集合-Nim游戏

    与普通\(NIM\)游戏不同的地方是限制了每次拿东西的个数,这个个数会给定在集合\(S\)中,也就是说每次拿的数量只能在集合\(S\)中. 现在就可以把每一堆石子看成是一个有向图了,最主要就是用记忆化 ...

  8. .NET生成微信小程序推广二维码

    前言 对于小程序大家可能都非常熟悉了,随着小程序的不断普及越来越多的公司都开始推广使用起来了.今天接到一个需求就是生成小程序码,并且与运营给的推广图片合并在一起做成一张漂亮美观的推广二维码,扫码这种二 ...

  9. C++ 共享内存ShellCode跨进程传输

    在计算机安全领域,ShellCode是一段用于利用系统漏洞或执行特定任务的机器码.为了增加攻击的难度,研究人员经常探索新的传递ShellCode的方式.本文介绍了一种使用共享内存的方法,通过该方法,两 ...

  10. UI自动化测试框架:数据驱动

    一.UI自动化框架介绍 测试框架使用了Po设计模式(Page Object),每一个页面用一个类来对应,这个类里面要实现所有核心页面元素的获取方法,类里面提供操作页面元素的所有方法. 这个框架实现几点 ...