摘要:本文(Historical Inertia: An Ignored but Powerful Baseline for Long Sequence Time-series Forecasting)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的短文,该文章提出了一种针对长时间序列的baseline。

本文分享自华为云社区《CIKM'21 Historical Inertia论文解读》,作者: 云数据库创新Lab 。

导读

本文(Historical Inertia: An Ignored but Powerful Baseline for Long Sequence Time-series Forecasting)是由华为云数据库创新Lab联合电子科技大学数据与智能实验室发表在顶会CIKM’21的短文,该文章提出了一种针对长时间序列的baseline。CIKM是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到短文投稿626篇,其中录用论文177篇,录取率约为28% 。该论文是云数据库创新LAB在时序分析层面取得的关键技术成果之一。

1 摘要

长序列时间序列预测(Long Sequence Time-series Forecasting,LSTF)因其广泛的应用而变得越来越流行。虽然人们已经提出了大量复杂模型来提高预测的有效性和效率,但却忽视或低估了时间序列一个最自然、最基本的特性:历史存在惯性。在本文中,我们提出了一个新的LSTF基线,即历史惯性(Historical Inertia, HI)。在此基线模型中, 我们直接将输入时间序列中距离预测目标最近的历史数据点作为预测值。我们在4个公开LSTF数据集,2个LSTF任务上评估了HI的效果,结果表明,与SOTA工作相比,HI可以获得高达82%的相对提高。同时,我们也讨论了HI和现有方法结合的可能性。

2 HI

HI直接将输入时间序列中距离预测目标最近的历史数据点作为预测值。

3 实验

3.1 单变量长时间序列预测结果

对于单变量长时间序列预测任务,HI在ETTh1和ETTm1数据集上显著优于SOTA模型。Informer及其变体主导了ETTh2数据集的最优结果。而对于Electricity数据集,HI,Informer和DeepAR都有较好的表现。整体来看,HI在MSE和MAE上分别实现了高达80%和58%的相对提高。

3.2 多变量长时间序列预测结果

对于多变量长时间序列预测任务,HI在四个数据集的绝大多数预测任务上都显著优于SOTA模型,最高带来了82%的相对提高。

4 讨论

4.1 为什么HI会有如此好的效果

我们从两个角度考虑了HI能取得良好效果的原因:

  • 数值 :HI可以保证预测序列与真实序列有相似的数值大小。
  • 周期性:对于有周期性且周期性较短的数据集,HI可以做到预测序列与真实序列相位相似。

4.2 如何利用HI

我们提出了两种利用HI的可能方向

  • 融合模型(Hybrid model):可以考虑将HI与其他模型融合,例如简单的作为一种trick将输出结果加权平均。
  • 自动机器学习(AutoML):某些情况下复杂模型可能并不能达到良好效果,因此可以考虑根据数据自适应模型结构,适当地降低/增加模型复杂度。

对于融合模型这一方向,我们设计了简单的实验予以验证:将HI与2层MLP模型的输出结果取平均得到最终预测结果。实验结果表明,融合HI的MLP模型可实现更准确的预测,并且此优势在单变量长时间序列预测任务上更显著。

华为云数据库创新lab官网:https://www.huaweicloud.com/lab/clouddb/home.html

点击关注,第一时间了解华为云新鲜技术~

解读顶会CIKM'21 Historical Inertia论文的更多相关文章

  1. TDSQL|三篇论文入选国际顶会SIGMOD,厉害了腾讯云数据库

    好消息!6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录. 本次被收录的研究成果中,新型数据结构设 ...

  2. [论文解读] 阿里DIEN整体代码结构

    [论文解读] 阿里DIEN整体代码结构 目录 [论文解读] 阿里DIEN整体代码结构 0x00 摘要 0x01 文件简介 0x02 总体架构 0x03 总体代码 0x04 模型基类 4.1 基本逻辑 ...

  3. 国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?

    作者 | 王骜 来源 | Serverless 公众号 导读 ​ USENIX ATC (USENIX Annual Technical Conference) 学术会议是计算机系统领域的顶级会议,入 ...

  4. InfoQ一波文章:AdaSearch/JAX/TF_Serving/leon.bottou.org/Neural_ODE/NeurIPS_2018最佳论文

    和 Nested Partition 有相通之处? 伯克利提出 AdaSearch:一种用于自适应搜索的逐步消除方法 在机器学习领域的诸多任务当中,我们通常希望能够立足预先给定的固定数据集找出问题的答 ...

  5. 阿里云数据库再获学术顶会认可,一文全览VLDB最新亮点

    一年一度的数据库领域顶级会议VLDB 2019于当地时间8月26日-8月30日在洛杉矶圆满落幕.在本届大会上,阿里云数据库产品团队浓墨登场,不仅有多篇论文入选Research Track和Indust ...

  6. opencv 相关一个很好的博客

    http://blog.csdn.net/zouxy09/article/category/1218765 图像卷积与滤波的一些知识点 图像卷积与滤波的一些知识点zouxy09@qq.comhttp: ...

  7. 【转载】 从ACM会议看中国大陆计算机科学与国外的差距

    ps:   这是一篇06年的文章,与今日的国内计算机行业学术圈环境简直是天翻地覆,很不错的history,值得mark下,今日的cs学术发展十号是坏不发表意见,但是history是值得对比,借鉴,思考 ...

  8. _fastcall

    * 1楼 __fastcall具体含义 在C语言中,假设我们有这样的一个函数: int function(int a,int b) 调用时只要用result = function(1,2)这样的方式就 ...

  9. Self Attention需要掌握的基本原理

    字面意思理解,self attention就是计算句子中每个单词的重要程度. 1. Structure 通过流程图,我们可以看出,首先要对输入数据做Embedding 1. 在编码层,输入的word- ...

  10. NLP领域的ImageNet时代到来:词嵌入「已死」,语言模型当立

    http://3g.163.com/all/article/DM995J240511AQHO.html 选自the Gradient 作者:Sebastian Ruder 机器之心编译 计算机视觉领域 ...

随机推荐

  1. Go语言代码断行规则详解

    本文深入探讨了Go语言中代码断行的各个方面,从基础概念到实际应用实践. 关注[TechLeadCloud],分享互联网架构.云服务技术的全维度知识.作者拥有10+年互联网服务架构.AI产品研发经验.团 ...

  2. Python 用户输入和字符串格式化指南

    Python 允许用户输入数据.这意味着我们可以向用户询问输入.在 Python 3.6 中,使用 input() 方法来获取用户输入.在 Python 2.7 中,使用 raw_input() 方法 ...

  3. 彻底掌握Python中 * 号

    Python中的 *号是一个特殊的符号,在其他编程语言中,它最广为人知的用途就是作为乘法运算的符号.而在Python中,它的用途远不止如此. 本文总结了Python中*号的所有用途,以供参考. 1. ...

  4. 7z 一键压缩备份

    该批处理已开源 开原地址: 点击进入 磁盘备份 工具有很多,如果你需要增量式备份的话,以下这些方法并不适合你.goodsync 可以了解一下. 以下方式仅适用于,懒人一键压缩备份. 对于我来说 定期的 ...

  5. 03Java学习_注释和代码规范

    注释和代码规范 目录 注释和代码规范 注释 注释介绍 单行注释 多行注释 文档注释 代码规范 注释 注释介绍 用于注解说明解释程序的文字就是注释,注释提高了代码的阅读性(可读性):注释 是一个程序员必 ...

  6. 28. 干货系列从零用Rust编写正反向代理,项目日志的源码实现

    wmproxy wmproxy已用Rust实现http/https代理, socks5代理, 反向代理, 静态文件服务器,四层TCP/UDP转发,内网穿透,后续将实现websocket代理等,会将实现 ...

  7. Android 的异步消息处理机制

    前言 Android中的异步消息处理机制主要有四部分:Message.Handler.MessageQuene.Looper.这一消息处理机制也称为Handler机制.Handler机制是支撑整个An ...

  8. Modbus转Profinet--TS-180 网关连接西门子 PLC 和工业称重仪表

    项目 随着科技的高速发展,工业自动化行业对日益多样的称重需求越来越高,上海某公司在国内的一个 工业自动化项目中,监控中心系统需要远程实时采集工业称重仪表测量的各种称重参数.该系统使用的是 西门子 S7 ...

  9. 《最新出炉》系列初窥篇-Python+Playwright自动化测试-34-处理https 安全问题或者非信任站点-下篇

    1.简介 这一篇宏哥主要介绍playwright如何在IE.Chrome和Firefox三个浏览器上处理不信任证书的情况,我们知道,有些网站打开是弹窗,SSL证书不可信任,但是你可以点击高级选项,继续 ...

  10. list.add()语句作用

    ----该方法用于向集合列表中添加对象 示例  本示例使用List接口的实现类ArrayList初始化一个列表对象,然后调用add方法向该列表中添加数据. public static void mai ...