日前,华为云在知识计算领域的多跳知识推理问答取得重大进展。基于自然语言处理领域的领先技术积累,华为云语音语义创新Lab联合华为诺亚方舟实验室在国际权威的HotpotQA评测Fullwiki Setting赛道荣登榜首,在答案模糊准确率和联合模糊准确率(Joint F1)等指标上均达到第一。

HotpotQA评测(Fullwiki Setting赛道)最新榜单(截至2021年1月20日)

作为企业重要的信息载体,数字化文档记录了大量企业知识,如何快速帮助企业员工从数字化文档中获得答案,是企业文档维护人员的痛点。为解决此问题,一方面需要较强的阅读理解技术,另一方面还需要构建一套复杂的开放域问答流程。

HotpotQA评测数据是斯坦福、CMU和蒙特利尔大学联合推出的新型问答数据集,由斯坦福的Manning教授和深度学习三巨头之一的Bengio牵头构建,该数据集由多跳复杂问题以及对应的答案组成,同时包含佐证证据用来解释答案的来源。在斯坦福此前公布的SQUAD评测任务中,机器已经多次超过人类,该评测仅需要从单个篇章中找到与问题有关的答案即可,故相对简单。然而,HotpotQA评测需要从整个wikipedia或者多篇文章中找出问题相关的答案,同时要求返回问题到答案的推理链,难度大大增加更具有挑战性。该评测也吸引了来自谷歌、微软、Facebook等知名研究机构以及CMU、Stanford、华盛顿大学、清华大学、北京大学等知名高校。

挑战多跳知识推理技术高点

HotpotQA评测的难点在于机器要结合多篇文章进行多跳推理才能得出答案,并返回佐证证据。该评测分为Distractor Setting和 Fullwiki Setting两个赛道。Fullwiki Setting相较于Distractor Setting更为复杂也更接近实用价值,需要从整个维基百科文档中抽取文档,然后再从文档中提取段落,最后从段落中抽取答案,而Distractor Setting赛道会提供10篇备选的篇章。如何从大量文档段落中去多跳搜索候选,然后理解候选段落的内容提取佐证证据成为比赛的关键。

华为云联合华为诺亚方舟实验室,提出了新的检索目标hop,用于收集维基百科中隐藏的推理证据,解决复杂多跳问题,同时结合beam search对答案进行排序和融合。

从维基百科文本图谱中检索跳转(Hops)

如今,企业面临着数字化、知识化转型,知识化转型重要的关键技术就是知识的理解和推理,该技术对企业知识转型具有重大的意义和推动作用。2020年华为云推出知识计算解决方案,企业可以基于华为云知识计算解决方案打造自己的知识计算平台,用于研发、生产、运营、销售、售后服务等企业核心流程。目前,该方案已在石油、汽车、医疗、化纤、煤焦化、钢铁、交通等行业率先实践。

点击关注,第一时间了解华为云新鲜技术~

华为云登顶HotpotQA多跳知识推理问答评测的更多相关文章

  1. 重磅!普惠AI--华为云语音语义万次调用1元购,有奖问答@评论区等你来!【华为云技术分享】

    活动快速入口:https://activity.huaweicloud.com/language_speech_promotion0.html 语音交互与自然语言处理 语音交互是一种人机交互方式,以开 ...

  2. python2.7下同步华为云照片的爬虫程序实现

    1.背景 随着华为手机的销量加大,华为云的捆绑服务使用量也越来越广泛,华为云支持自动同步照片.通讯录.记事本等,用着确实也挺方便的,云服务带来方便的同时,也带来了数据管理风险.华为目前只提供一个www ...

  3. 华为云·寻找黑马程序员#海量数据的分页怎么破?【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  4. OpenCV图像识别初探-50行代码教机器玩2D游戏【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  5. webpack4.0各个击破(6)—— Loader篇【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  6. 移动端开发语言的未来的猜想#华为云·寻找黑马程序员#【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  7. MongoDB 谨防索引seek的效率问题【华为云技术分享】

    目录 背景 初步分析 索引seeks的原因 优化思路 小结 声明:本文同步发表于 MongoDB 中文社区,传送门:http://www.mongoing.com/archives/27310 背景 ...

  8. 使用Python开发小说下载器,不再为下载小说而发愁 #华为云·寻找黑马程序员#

    需求分析 免费的小说网比较多,我看的比较多的是笔趣阁.这个网站基本收费的章节刚更新,它就能同步更新,简直不要太叼.既然要批量下载小说,肯定要分析这个网站了- 在搜索栏输入地址后,发送post请求获取数 ...

  9. 大型情感剧集Selenium:6_selenium中的免密登陆与cookie操作 #华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  10. python让你再也不为文章配图与素材发愁,让高清图片占满你的硬盘! #华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

随机推荐

  1. 12. 用Rust手把手编写一个wmproxy(代理,内网穿透等), TLS的双向认证信息及token验证

    12. 用Rust手把手编写一个wmproxy(代理,内网穿透等), TLS的双向认证信息及token验证 项目 ++wmproxy++ gite: https://gitee.com/tickbh/ ...

  2. Python 环境迁移

    平时用python环境会装一堆依赖,也包括自己的模块,要迁移到陌生环境,得好好处理才行. 下面介绍个方法,实践过还可以: 总结下步骤: miniconda或conda安装一个python环境,pyth ...

  3. 《最新出炉》系列初窥篇-Python+Playwright自动化测试-22-处理select下拉框-上篇

    1.简介 在实际自动化测试过程中,我们也避免不了会遇到下拉框选择的测试,因此宏哥在这里直接分享和介绍一下,希望小伙伴或者童鞋们在以后工作中遇到可以有所帮助.今天,我们讲下playwright的下拉框怎 ...

  4. 一键修改IP多实例

    一键修改IP多实例-v1 #!/bin/bash #2020-03-01 #auto change ip #By Flyaway ###################### grep "d ...

  5. 「Eolink Apikit 教程」API 异常监控-创建 API 监控

    API 监控能够确保 API 的稳定性.如果一个 API 出现故障或崩溃,它可能会导致整个应用程序无法正常工作.这对用户和业务来说可能是灾难性的.通过监控 API,开发团队可以及时发现问题并采取措施来 ...

  6. JVM-JAVA基本类型

    1 package javap.fload; 2 3 import static jdk.nashorn.internal.objects.Global.Infinity; 4 5 public cl ...

  7. .NET8 WebApplication剖析

    ​ WebApplication 是用于配置HTTP管道和路由的web应用程序,接来下我将一一拆解它的组成. /// <summary> /// The web application u ...

  8. IIS和PHP相关权限问题及解决方案_500错误_500.19 - Internal Server Error与401未授权错误_401.3 - Unauthorized

    在IIS添加网站(假设站点为xxx.yyy.com,本例假设IIS版本为7.5或以上),如果采用IIS默认配置,会在创建站点同时创建相应同名的"应用程序池"(也是xxx.yyy.c ...

  9. Net 高级调试之十:轻量级代码生成的调试

    一.简介 今天是<Net 高级调试>的第十篇文章.说起来,高级调试,调试的内容还是挺多的,技巧也不少,但是,要想做一个合格的高级调试人员,还需要掌握如何调试动态生成的IL代码.今天要探讨的 ...

  10. 浅析MySQL代价模型:告别盲目使用EXPLAIN,提前预知索引优化策略

    背景 在 MySQL 中,当我们为表创建了一个或多个索引后,通常需要在索引定义完成后,根据具体的数据情况执行 EXPLAIN 命令,才能观察到数据库实际使用哪个索引.是否使用索引.这使得我们在添加新索 ...