2018年8月29日,由美团、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”正式启动。美团CTO罗道峰、创新工场CEO李开复、搜狗CEO王小川和美图CEO吴欣鸿共同启动了本次大赛,盛况空前。本次大赛整体奖金规模超过300万人民币。

想报名的同学,点这里

本次大赛共投入千万元规模以上的资金,建设了十余个全新高质量数据集,已成为目前国内规模最大的科研数据集平台和最大的非商业化竞赛平台。在2017年,有来自全球65个国家的8892支团队参加了大赛,覆盖国内外347所高校,273家企业,而今年这些记录有望被打破。

用AI挑战真实世界的问题

AI竞赛可以吸引和培养人才,展示最新思想和技术,打造良性可持续的AI科研与应用生态。2018年大赛的主题为“用AI挑战真实世界的问题”,共包括5个主赛道和5个实验赛道。美团主要负责了其中两个颇具挑战性的主赛道赛题:细粒度用户评论情感分析(题目来自美团基础研发平台AI平台部NLP中心)和无人驾驶视觉感知(题目来自美团大零售事业群无人配送部)。

美团两个赛道的奖项设置均为:

以下提及金额为税前金额,详细规则请参考《竞赛选手报名协议

总决赛

  • 冠军:400,000人民币,颁发获奖证书;辅导教师奖10,000人民币
  • 亚军:40,000人民币,颁发获奖证书;辅导教师奖2,000人民币
  • 季军:20,000人民币,颁发获奖证书;辅导教师奖2,000人民币
  • 优秀奖(第4、5名):5,000人民币,颁发获奖证书;辅导教师奖2,000人民币

双周赛

  • 冠军:5,000人民币
  • 亚军:3,000人民币
  • 季军:2,000人民币

细粒度用户评论情感分析

为了促进中文自然语言处理技术(NLP)的发展,作为联合主办方,美团的NLP中心承担本次“全球AI挑战赛”主赛道赛题——“面向餐饮领域在线评论的细粒度情感分析”。美团作为全球最大的生活服务电子商务平台,拥有丰富而高质量的在线餐饮评论。在本次大赛中,美团提供了截至目前全球最大的中文餐饮评论细粒度情感标注数据集。相对于现有情感分析领域的数据,本次竞赛中美团数据集具有以下特色:

第一,目前情感分析领域数据集大多集中在影评、购物等领域,中文餐饮领域的数据集较少,此次提供的数据集极大丰富了中文餐饮领域情感分析的数据资源,从而进一步推动让机器理解人类情感的AI技术发展。

第二,数据更加丰富。本次大赛数据来自国内餐饮评价权威App——大众点评的真实公开的用户评论,标注在线评论量达到15万条,是国内目前为止最大最全的面向餐饮领域的细粒度情感分析的数据集。作为全球最大的提供多品类服务的电子商务平台之一,美团拥有广大用户群体和极高的地域覆盖度,因此数据更加丰富,质量更高,且非常具有代表性。

第三,标注体系更加合理。结合美团内部长期的数据使用经验,本数据集的采样和标注方法更科学合理,依据粒度不同构建双层标注体系:第一层为粗粒度的评价对象,第二层为细粒度的情感对象,共包含6大类20个细粒度要素。且每条数据都经过至少两位专业数据标注人员的确认,数据贴近真实应用场景,为本次比赛提供了坚实而可靠的数据支持,共同打造良性可持续的AI科研新生态。

面向商家的情感分析数据集充分汇集了广大用户对于商户的高质量评价,是美团正在构建中的全球最大餐饮娱乐知识图谱中非常重要的组成部分。美团知识图谱能够从细分维度刻画商家,根据用户偏好更精准地推荐适合用户口味、服务、价格、环境、位置的商家。据美团NLP中心负责人王仲远介绍,目前美团知识图谱中的情感分析模型已经在多个应用场景中落地,为用户提供智能AI服务:

第一,改进大众点评上的搜索排序。当用户在大众点评的APP上进行搜索找店时,通过知识图谱中商户评价情感分析数据,优先展示用户评价中反馈较好的商户,真正助力于“让大家吃得更好,生活更好”。

第二,优化外卖商家的品质分级。通过引入知识图谱中针对商家评论中的细粒度的情感分析结果,来收集实际用户对于商家在不同维度的满意程度,指导业务拓展人员及时帮助商家发现并解决相关问题。

第三,打造有“情感识别能力”的智能客服。通过细粒度的情感分析模型,美团正在打造能够识别开心、表扬、不满、愤怒等情绪的智能客服机器人,始终坚持“以客户为中心”的理念,及时发现用户反馈问题时的情绪,帮助用户快速解决问题。

总体而言,细粒度情感分析技术对学术界与工业界有深刻的影响,此次竞赛中,美团提供的面向餐饮领域在线评论的细粒度情感分析数据集将面向全社会开放,希望吸引更多优秀的AI人才参与到相关模型的研发之中,共同促进NLP技术的升级,用AI优化人们的生活体验。

无人驾驶视觉感知

自动驾驶技术将随时改变我们的出行和生活方式。为了探索无人驾驶的前沿感知算法,本次全球AI挑战赛设置了自动驾驶主赛道。该赛道由伯克利自动驾驶产业联盟(BDD)及刚刚推出无人驾驶开放平台的美团负责,无论在数据集的规模和质量,还是赛题的设置,都极具挑战性。

在数据集方面,本赛道采用了UC Berkeley 2018年最新发布的BDD数据集。BDD数据集是全世界最庞大、最复杂,可以推动自动驾驶发展的数据集。这套数据集包含原始图片1.2亿张,标注图片10万张,涵盖了美国四个区域多样的天气条件,以及白天黑夜的不同光照情况。BDD中包含了道路目标检测、道路目标分割、可行驶区域、车道线等多种标注。本次比赛使用了道路目标检测和可行驶区域两方面的标注。道路目标检测包括行人、交通灯、交通标志,以及多种车辆。可行驶区域包括优先通行区域以及非优先通行区域。这种复杂的数据分布也使得本次比赛更具有挑战性。

无人驾驶算法部分按模块可以分为感知、定位、决策控制,本次挑战任务主要集中在感知模块,包含了检测和分割两个方向。检测是在一幅图片中框选出目标物体的位置,并给出目标物体的类别。检测主要应用于无人驾驶中的障碍物检测,使得无人车可以在行驶中进行主动的避障。分割是对一副图片中的每个像素进行分类,主要应用于一些区域的检测,以及识别出一些物体的完整轮廓。

本次挑战美团创造性的将两方面任务结合到了一起,希望选手能在通过多任务学习来同时解决两个问题,并且保证模型的轻量和快速。多任务学习是迁移学习的一种,也是目前比较前沿的领域。本次比赛是业界非常少有的涉及到迁移学习的比赛,并且本次比赛将模型运行时间列入考量也是非常新颖的地方。

值得一提的是,检测和分割这两个自动驾驶的任务在美团目前的业务中也均有落地应用。当前自动驾驶技术虽尚不成熟,但相对于开放道路上实现载人的自动驾驶,在低速的限定环境内的配送场景内,实现自动驾驶已经指日可待。

无人配送是人工智能的典型落地场景,完成无人配送需要自动驾驶技术、机器人技术、视觉分析,自然语言理解,机器学习、运筹优化等一系列创新技术的高度集成。国内的配送需求量巨大,场景复杂具有中国特色,为人工智能发展应用落地提供业务支撑,需要国内完全的自主创新而非“拿来创新”,无人配送的成功应用将标志着包括自动驾驶,机器人控制,机器学习等一些列的创新技术实现了重大突破,在应用场景的倒逼下,中国无人配送技术及应用领域将有机会成为世界的前沿。

美团致力用先进的无人驾驶技术,对配送侧进行改革,增加运力的供给。美团无人配送车主要运用自主研发的路径规划和避障算法,通过摄像头和激光雷达等元器件判断障碍物,实时计算行进路线,进而使得产品技术完整度高,既可以按照既定路线自动导航行驶,而且也具备路径规划、智能避障、车道保持、智能跟随等功能。

美团目前已正式加入加州大学伯克利DeepDrive深度学习自动驾驶产业联盟,同时与清华大学签订了框架合作。美团还将持续与高校实验室通力合作,既有自主研发,同时借鉴引进其他先进经验,在无人配送场景、数据等方面加快自动驾驶的技术创新、理论创新、以及落地应用的进程。

美团是首次参与主办AI Challenger全球挑战赛,两个主赛道的数据集和命题分别由NLP中心王仲远团队和无人配送部夏华夏团队负责。在筹备大赛期间两个团队都付出了巨大努力。比如细粒度用户评价数据集,由350位数据标注人员共投入了近6万小时。无人配送部在比赛命题方面,设计了一种业界首创的评测体系,同时考察模型准确性与运行时间。 在此,特别感谢NLP中心和无人配送部对此次大赛的鼎力支持。

招聘信息

美团点评NLP团队招聘各类算法人才,Base北京上海均可。NLP中心使命是打造世界一流的自然语言处理核心技术和服务能力,依托NLP(自然语言处理)、Deep Learning(深度学习)、Knowledge Graph(知识图谱)等技术,处理美团点评海量文本数据,打通餐饮、旅行、休闲娱乐等各个场景数据,构建美团点评知识图谱,搭建通用NLP Service,为美团点评各项业务提供智能的文本语义理解服务。我们的团队既注重AI技术的落地,也开展中长期的NLP及知识图谱基础研究。目前项目及业务包括美团点评知识图谱、智能客服、语音语义搜索、文章评论语义理解、美团点评智能助理等。真正助力于“让大家吃得更好,生活更好”企业使命的实现,优化用户的生活体验,改善和提升消费者的生活品质。欢迎各位朋友推荐或自荐至 hr.ai@meituan.com。

算法岗NLP算法工程师/专家/研究员 、知识图谱算法工程师/专家/研究员

工程岗C++/Java研发专家/工程师 、AI平台研发工程师/专家

产品岗AI产品经理/专家(NLP、数据方向)

发现文章有错误、对内容有疑问,都可以关注美团技术团队微信公众号(meituantech),在后台给我们留言。我们每周会挑选出一位热心小伙伴,送上一份精美的小礼品。快来扫码关注我们吧!

300万大奖:欢迎参加美团联合主办的全球AI挑战赛的更多相关文章

  1. 深圳即将启动首届「全国人工智能大赛」:超过 500 万大奖 & 政府资助,潜信息你读懂了吗!

    人工智能加速“视频/视觉”发展,近期,深圳市即将迎来人工智能领域权威赛事之一——首届「全国人工智能大赛」(The First National Artificial Intelligence Chal ...

  2. NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)

    NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)       七月,酷暑难耐,认识的几位同学参加知乎看山杯,均取得不错的排名.当时天池AI医疗大赛初赛结束,官方正在为复赛进行平台调 ...

  3. 【阿里聚安全·安全周刊】Python库现后门 可窃取用户SSH信息|Facebook再曝300万用户数据泄露

    本周七个关键词:Python库现后门丨Facebook再曝数据泄露丨加密协议被曝严重漏洞丨英国报摊将出售"色情通行证"丨HTTPS的绿色锁图标丨机器学习和预测应用的API丨Ecli ...

  4. Java 线程池 +生产者消费者+MySQL读取300 万条数据

    1.1需求 数据库300 万条用户数据 ,遍历获取所有用户, 各种组合关联, 获取到一个新的json ,存到redis 上. 1.2 难点 数据库比较多, 不可能单线程查询所有的数据到内存. 1.3解 ...

  5. 阿里云Redis性能测试结果(1个集合存300万数据,查询能几秒返回结果)

    现状: 1.买了一台主从的阿里云Redis,内存就1GB. 2.查询了阿里云的帮助,没有找到性能相关的说明, 有的也是4GB版本的并发性能 3.提工单问客服 一个集合里有300万数据,单次查询性能大概 ...

  6. 300万运算/秒 :VoltDB在电信行业基准测试上可线性扩展性能

    01 总 体 概 述 VoltDB受到全球电信软件解决方案提供商的信赖,后者将其作为首选内存数据库来驱动他们部署在全球100多家运营商处的任务关键型应用.VoltDB受到青睐的原因在于其性能和功能不仅 ...

  7. 300万PV的ASP.NET网站使用阿里云的配置建议

    @老牛吃肉在博文“今天的访问高峰,扛过去了”的评论中询问了这样一个问题: 你好,站长,本公司正在考虑用阿里云.用途:互联网网站,主要站点:asp.net开发目前的考虑情况:访问ip 15-20万,pv ...

  8. 赵海军获任中芯国际CEO 邱慈云留任副董事长、非执行董事(年薪40万美元+300万股票的认购权)

    集微网消息,中芯国际今日宣布,由赵海军博士接替邱慈云博士担任中芯国际首席执行官,邱慈云博士将留任副董事长.非执行董事,并于2017年6月30日前担任公司全职顾问,于当日生效.邱博士将与赵博士紧密合作, ...

  9. 光环国际联合阿里云推出“AI智客计划”

    2018阿里巴巴云栖大会深圳峰会3月28日.29日在大中华喜来登酒店举行,阿里云全面展示智能城市.智能汽车.智能生活.智能制造等产业创新. 3月28日下午,以"深化产教融合,科技赋能育人才& ...

随机推荐

  1. ETL测试基本知识

    转载自: https://www.cnblogs.com/clarke157/p/6383024.html 一.ETL测试的重要性: ETL(Extract-Transform-Load的缩写,即数据 ...

  2. pandas空值处理与插值

    # coding:utf-8 import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy.int ...

  3. 20165329 Java实验二:面向对象编程

    实验内容: 面向对象程序设计-1 实验要求: 提交最后三个JUnit测试用例(正常情况,错误情况,边界情况)都通过的截图 实验步骤: 1.按照老师博客的要求新建一个MyUtil项目 在src内新建ja ...

  4. 【CTF MISC】文件内容反转方法-2017世安杯CTF writeup详解

    Reverseme 用winhex打开,发现里面的字符反过来可以正常阅读,所以文件被倒置了 Python解题程序如下 with open('reverseMe','rb') as f: with op ...

  5. USB descriptor【转】

    struct usb_device_descriptor { __u8 bLength;//设备描述符的字节数大小,为0x12 __u8 bDescriptorType;//描述符类型编号,为0x01 ...

  6. 编译器是如何实现32位整型的常量整数除法优化的?[C/C++]

    引子 在我之前的一篇文章[ ThoughtWorks代码挑战——FizzBuzzWhizz游戏 通用高速版(C/C++ & C#) ]里曾经提到过编译器在处理除数为常数的除法时,是有优化的,今 ...

  7. 玩玩 Nginx 1----- Nginx + ngx_lua安装测试【CentOs下】

          最近打算搞搞nginx,扒着各位先驱的文章自己进行测试下,中间过程也是错误不断,记录一下,以备使用.       nginx的安装挺简单的,主要还是研究下一些第三方的模块,首先想试下初始化 ...

  8. Flask:使用Eclipse+PyDev插件编辑基于package的项目

    Windows 10家庭中文版,Python 3.6.4,Flask 1.0.2,Eclipse Oxygen.1a Release (4.7.1a),PyDev 6.3.2 本文记录了 使用Ecli ...

  9. KnockoutJs学习笔记(二)

    这篇文章主要用于记录学习Working with observable arrays的测试和体会. Observable主要用于单一个体的修改订阅,当我们在处理一堆个体时,当UI需要重复显示一些样式相 ...

  10. PHP XML操作的各种方法解析

    PHP提供了一整套的读取 XML文件的方法,很容易的就可以编写基于 XML的脚本程序.本章将要介绍 PHP与 XML的操作方法,并对几个常用的 XML类库做一些简要介绍. XML是一种流行的半结构化文 ...