摘要:本文是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。

本文分享自华为云社区《CIKM'21 PeriodicMove论文解读》,作者:云数据库创新Lab。

导读

本文(PeriodicMove: shift-aware human mobility recovery with graph neural network)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的文章,该文章提出首个克服人类移动轨迹数据中普遍存在的多层次周期性、周期偏移现象以及数据稀疏问题的轨迹恢复模型。CIKM是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到投稿1251篇,其中录用论文271篇,录取率约为21.7% 。该论文是云数据库创新LAB在轨迹分析层面取得的关键技术成果之一。

1 摘要

随着各种基于位置的服务的推出,将稀疏的人类移动轨迹数据进行恢复补全以提升这些下游任务的准确率显得尤为重要。然而人类移动轨迹数据的恢复面临着较大的挑战:

  • 轨迹中轨迹点之间具有复杂的转移模式
  • 人类移动轨迹数据中普遍存在多层次周期性以及周期偏移现象
  • 现目前采集的轨迹数据是相对稀疏的

在本文中,我们提出了一个名为PeriodicMove的基于图神经网络的人类行为轨迹恢复模型,在该模型中,我们首先对每条历史轨迹构建有向图,并使用图神经网络捕捉位置之间的复杂转移模式;之后,我们设计了两个注意力机制分别捕捉人类行为轨迹的多层次周期性与周期偏移性;最后,我们设计了一个空间感知的损失函数来将位置的空间临近信息引入到模型中,从而一定程度上缓解了数据稀疏问题。我们在两个具有代表性的人类轨迹数据集上做了大量实验,实验结果表明,我们的模型PeriodicMove相对于目前SOTA模型获得了2.9%-9%的大幅性能提升。

2 模型

2.1 模型架构

我们的模型主要包括五个部分:图神经网络层、时序嵌入层、两个注意力机制层以及最后的融合恢复层

2.2 图神经网络层

为了捕捉轨迹中轨迹点之间复杂的空间转移关系,我们首先将每条轨迹按照如图所示方式进行建图,然后利用图神经网络来学习有向图中轨迹节点之间复杂的空间转移模式

2.3 时序嵌入层

我们采用《Attention is all you need》中提到的利用三角函数中相对相位来刻画轨迹序列中的相对顺序关系,然后我们将图神经网络层以及时序嵌入层的结果拼接起来,形成包含复杂时空依赖关系的嵌入向量表示

2.4 注意力机制层

Cross Attention Layer主要用于解决人类移动轨迹数据中的周期偏移现象,我们将当前时刻t的移动模式与每一条历史轨迹中所有时刻的移动模式进行比较,基于一个相似性权重将相关的历史信息聚合在历史轨迹的t时刻以解决周期偏移现象

在经过Cross Attention Layer后,每一条历史轨迹的每个时刻的轨迹点表示可以理解为根据当前待补全轨迹的每个时刻进行了偏移校准。接下来在Soft Attention Layer中,我们将当前轨迹的第t时刻与每一条历史轨迹的第t时刻的轨迹表示进行一个attention操作,形成一个包含历史轨迹中的多层次周期性的历史轨迹表示

2.5 融合恢复层

在最后的融合恢复层,我们利用包含复杂时空依赖关系、包含多层次周期性且克服了周期偏移现象的历史轨迹增强序列辅助当前轨迹来进行最后的补全恢复

2.6 设计Distance Loss

在轨迹数据高度稀疏的场景下,交叉熵损失不能很好地捕捉空间邻近性,而空间邻近性是人类移动恢复的重要特征。因此,我们设计了一个距离损失函数,以纳入空间邻近信息的模型,并且采用了 Noise Contrastive Estimation (NCE)来加速模型的训练,可视化结果显示,加入了Distance Loss能够有效帮助模型捕捉空间邻近信息

3 实验

3.1 实验结果

我们的模型PeriodicMove相对于目前SOTA模型(2021-AAAI)获得了2.9%-9%的大幅性能提升

3.2 消融实验

我们对模型五个部分分别进行了消融实验,从实验结果中可以看出每个模块对于我们的任务都有一定的贡献,其中Soft Attention Layer模块去掉后,模型效果下降最快,说明人类移动轨迹数据恢复任务中多层次周期性起着非常大的作用

3.3 鲁棒性实验

我们将本模型与最新的SOTA模型(2021-AAAI)进行一个在不同缺失率下的鲁棒性实验,从实验结果中可以看出,两个模型都具有较好的鲁棒性,但是我们的模型在各个缺失率下的效果都在AttnMove上有一定的提升

4 应用

在各种基于位置的服务中如:个性化地理位置推荐、城市智能交通调度以及轨迹异常检测等诸多场景,只要是收集到的轨迹数据是稀疏的都会影响这些下游任务的准确率。我们论文的目的是将稀疏的轨迹数据恢复成稠密且精细的轨迹数据,以提高这些下游任务的准确率

华为云数据库创新lab官网:https://www.huaweicloud.com/lab/clouddb/home.html

点击关注,第一时间了解华为云新鲜技术~

顶会CIKM'21论文解读:基于图神经网络的人类行为轨迹恢复模型的更多相关文章

  1. PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]

    PGL图学习之图神经网络ERNIESage.UniMP进阶模型[系列八] 原项目链接:fork一下即可:https://aistudio.baidu.com/aistudio/projectdetai ...

  2. 图神经网络之预训练大模型结合:ERNIESage在链接预测任务应用

    1.ERNIESage运行实例介绍(1.8x版本) 本项目原链接:https://aistudio.baidu.com/aistudio/projectdetail/5097085?contribut ...

  3. 知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2021)-KG4SL:用于人类癌症综合致死率预测的知识图神经网络

    5.(2021.7.12)Bioinformatics-KG4SL:用于人类癌症综合致死率预测的知识图神经网络 论文标题:KG4SL: knowledge graph neural network f ...

  4. zz【清华NLP】图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐

    [清华NLP]图神经网络GNN论文分门别类,16大应用200+篇论文最新推荐 图神经网络研究成为当前深度学习领域的热点.最近,清华大学NLP课题组Jie Zhou, Ganqu Cui, Zhengy ...

  5. NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

    NLP知识图谱项目合集(信息抽取.文本分类.图神经网络.性能优化等) 这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习. 1. 信息抽取项目合集 1.PaddleN ...

  6. CIKM 18 | 蚂蚁金服论文:基于异构图神经网络的恶意账户识别方法

    小蚂蚁说: ACM CIKM 2018 全称是 The 27th ACM International Conference on Information and Knowledge Managemen ...

  7. 论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)

    摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...

  8. 解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法

    摘要:本文提出了两个用于无监督的具备可解释性和鲁棒性时间序列离群点检测的自动编码器框架. 本文分享自华为云社区<解读ICDE'22论文:基于鲁棒和可解释自编码器的无监督时间序列离群点检测算法&g ...

  9. AAAI2019 | 基于区域分解集成的目标检测 论文解读

    Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测 论文解读 作者 | 文永亮 学 ...

  10. 论文阅读: CCF A 2022 MVD: 基于流敏感图神经网络的内存相关漏洞检测 (ICSE)

    Motivation: 内存相关漏洞会导致性能下降和程序崩溃,严重威胁到现代软件的安全性. 静态分析方法使用一些预定义的漏洞规则或模式来搜索不正确的内存操作,然而,定义良好的漏洞规则或模式高度依赖于专 ...

随机推荐

  1. java_2.常量、Scanner类、基本数据类型转换、算数运算符

    常量.Scanner类.基本数据类型转换.算数运算符 变量和常量 常量 1.使用final关键字修饰,只能赋值一次,不可以修改值. 2.常量的名称使用全大写. 3.多个单词使用下划线分隔. publi ...

  2. JAVA类的加载(1) ——类的加载及类加载器介绍

    过程:当程序主动使用某个类时,如果该类还未被加载到内存中,系统会通过加载.连接.初始化三个步骤来对该类进行初始化,有时候称为类加载(类初始化)   类加载 定义:类加载 指的是将类的class文件读入 ...

  3. 文心一言 VS 讯飞星火 VS chatgpt (135)-- 算法导论11.3 1题

    一.用go语言,假设我们希望查找一个长度为 n 的链表,其中每一个元素都包含一个关键字k并具有散列值h(k).每一个关键字都是长字符串.那么在表中查找具有给定关键字的元素时,如何利用各元素的散列值呢? ...

  4. 《最新出炉》系列初窥篇-Python+Playwright自动化测试-29-处理日历时间控件-中篇

    1.简介 上一篇的日历时间控件宏哥介绍的比较传统也是很常见的.宏哥不能说它很low,但是相比较一些高端.大气.上档次的日历时间控件,结果就一目了然了:确实很low. 2.被测网站 2.1高大上日历时间 ...

  5. uni-app框架开发app发布流程

    uni-app框架开发app发布流程 1.首先公司申请软著 步骤:申请软著详细流程 - 阿长*长 - 博客园 (cnblogs.com) 一.安卓端 1,点击发行>原生-app云打包 正式包和自 ...

  6. 通过计算巢轻松部署Salt服务

    SaltStack服务实例部署 概述 Salt基于Python构建,是一个事件驱动的自动化工具和框架,用于部署.配置和管理复杂的IT系统.使用Salt来自动化公共基础设施管理任务,并确保基础设施的所有 ...

  7. 一篇学会cron表达式

    1.定义 Cron表达式是一种用于定义定时任务的格式化字符串.它被广泛用于Unix.Linux和类Unix系统中,用于在指定的时间执行预定的任务.Cron表达式由6个字段组成,每个字段通过空格分隔开. ...

  8. 数据集成平台关于【源平台调度&任务生命周期】

    任务调度者 调度事件 生产任务 调度任务池-异步
AsynDispatcher --source 实例化适配器执行 消费任务 实例化集成应用 DataHub Instance
handleSource ...

  9. 什么是Session;request.getSession().setAttribute()

    Session:会话控制,是服务器为了保存用户状态而创建的一个特殊的对象.=>用于存储信息的一个对象 当我们在服务端使用session时,首先要获取session,下面这个图就对服务器获取ses ...

  10. 搭建一个简易的IPv6网络测试环境

    背景 近期一个项目要求产品在IPv6网络环境部署,在此之前所有的项目网络环境都是IPv4,为了验证产品网络适配能力,需要搭建一套IPv6的网络测试环境,网上搜了很多教程,也在某东找了很多路由器,对于如 ...