AI 的下一个重大挑战:理解语言的细微差别
简评:人类语言非常博大精妙,同一句话在不同的语境下,就有不同的含义。连人类有时候都不能辨别其中细微的差别,机器能吗?这就是人工智能的下一个巨大挑战:理解语言的细微差别。本文原作者是 Salesforce 的首席科学家 Richard Socher。
语言是人类独有的能力,是我们智慧的体现。但是通过人工智能(我们为机器提供语言能力的NLP)为我们如何使用语言打开了一个新的可能性领域。
今天,Alexa 能够帮你调节智能灯的亮度,也可以告诉你世界另一端的天气状况。在 Google 最近的 Duplex 演示中,AI 还能够进行商务呼叫或者预定约会,曾经存在于科幻小说里的场景在今天变成了现实。但是,对于机器来说,如何进行更为直观、更有语境和更加自然的对话依然是个挑战。而 NLP技术,它和人工智能本身一样古老,我们仍然处在这个旅程的起步阶段。
语言是共享信息并与我们周围的人联系的机制,但是机器需要理解语言的复杂之处,以及我们作为人类,如何交流才能使用语言。在情感分析、问答系统和联合多任务学习方面的进步,是人工智能得以能够真正理解人类和我们沟通的方式。
情感分析
语言从本质上来说就很难,它不断进化,非常微妙。
通过情感分析,我们可以使用 AI 来理解关于特定陈述的某些事情,如品牌介绍、电影评论是积极的、消极的还是中立的。我们也可以弄清楚谈话者的态度和意图(是否生气了?快乐吗?感到惊讶吗?)。从客户服务到在线社区审核,再到算法交易,通过及时分析成千上万的推文或数百条产品评论,了解公众对一个品牌的看法,对企业来说,是非常有价值的。
情感分析已经存在了一段时间,但并不总是非常准确。然而,随着 NLP 技术的进步,情况正在发生改变。在 Salesforce,Einstein AI 服务就能够让品牌厂商从聊天中实时分析电子邮件、社交媒体和文本中的情绪,以便提供更好的客户体验。它还可以用来识别产品缺陷,通过社交媒体渠道监控公众对品牌的看法。
我们还需要能够理解上下文的能力。假设有人在推特上说:“某种香皂真的很适合婴儿呢。”这可以认为是对儿童香皂的积极认可,但也有可能是反话,暗示这种香皂对孩子来说是可怕的。
因此,语义需要结合上下文来看。教会 AI 来解析句子所有的可能含义,并理解某个人在特定语境中想要表达的真实含义,是 NLP 研究中的重大挑战之一。它既需要标记数据来改进模型训练,也需要能够学习上下文并同时在不同任务之间共享知识的新模型。
问答系统
现在,Siri 和 Google Assistant 等应用已经能够很好地回答常见问题了,并能够执行一些简单的命令。但在理想情况下,我们应该可以向计算机提出任意问题,并得到足够好的回答。
提供更好的答案的一个方法是确保计算机能够理解问题。
如果你问,「When will my plane arrive?」,plane 有飞机和木工工具的含义。所以你问的是航班呢,还是从 Amazon 订购的木工工具呢?
只有通过更深入地理解语义,以及更加智能地使用上下文数据,计算机才能越来越善于猜测我们表达的意思。有了 NLP,我们才能弄清楚如何学习这些上下文。
联合多任务学习
科研界擅长的是构建能够很好地完成单一任务的人工智能模型。但会话式和上下文相关的界面将需要一个能够不断学习的人工智能模型 —— 将新任务与旧任务集成,并在此过程中学习执行更为复杂的任务。人工智能在通常情况下都是如此,但在语言方面尤为如此,这是因为语言具有灵活性。
例如,问题:谁是我的客户。
这个问题提出了一个很简单的任务,即创建一个客户列表。但如果问题变成:谁是我们在环太平洋区域的特定产品的最佳客户。问题就增加了一层复杂性。比如,如何定义「最佳」;每个客户都住在哪里?让客户对某种产品感到兴趣都有哪些因素?通过向查询添加一个项目,问题的复杂性就会显著增加了。
Saleforce Research 最近创建了「自然语言十项全能 (Natural Language Decathlon)」,这是一个挑战,利用问答功能在单一模型中解决了 NLP 最棘手的 10 项任务:问答系统、机器翻译、摘要、自然语言推理、情感分析、语义角色标注、关系提取、目标导向对话、数据库查询生成和代词解析。
随着研究人员不断改进这样的模型,我们将看到人工智能界面在承担更复杂的任务时,会变得更加智能。
尽管在 NLP 领域中,我们仍然处于起步阶段。不过,随着 NLP 的进步,人工智能能够改变我们与机器交互的一切方式。
原文链接:AI’s Next Great Challenge: Understanding the Nuances of Language
AI 的下一个重大挑战:理解语言的细微差别的更多相关文章
- Go 语言的下一个大版本:Go 2.0 被安排上了(全面兼容1.X,改进错误处理和泛型这两大主题)
今年 8 月 Go 开发团队公布了 Go 2.0 的设计草案,包括错误处理和泛型这两大主题.现在备受瞩目的 Go 2.0 又有了新动向 —— 昨日 Go 开发团队在其官方博客表示,Go 2 已经被安排 ...
- Go将统治下一个10年?Go语言发展现状分析
“本文是国内Go语言大中华区首席布道师——许式伟,在QCon2015上海站上的分享.他预测Go语言10年内一定会超过C和java,并且统治这一个10年. Go语言语法及标准库变化 Go从1.0版本到现 ...
- 剑指Offer的学习笔记(C#篇)-- 二叉树的下一个节点(好理解版本)
题目描述 给定一个二叉树和其中的一个结点,请找出中序遍历顺序的下一个结点并且返回.注意,树中的结点不仅包含左右子结点,同时包含指向父结点的指针. 一 . 理解题意 该题目我们可以借鉴一个非常影响不好的 ...
- Go语言实现:【剑指offer】二叉树的下一个结点
该题目来源于牛客网<剑指offer>专题. 给定一个二叉树和其中的一个结点,请找出中序遍历顺序的下一个结点并且返回. 注意,树中的结点不仅包含左右子结点,同时包含指向父结点的指针. Go语 ...
- 从谷歌Pixel3不堆硬件看智能手机下一个十年将被AI制霸
别看现在的智能手机行业热闹异常--厂商混战.新品频出.噱头涌现,但能引领手机行业发展趋势的依旧是苹果和谷歌.如果说苹果的iPhone树立了一个个智能手机行业进化的标杆,那么谷歌其实就是在为安卓手机的发 ...
- Token:共识的下一个100年,区块链技术是无可阻挡的文明进程
Token:共识的下一个100年,区块链技术是无可阻挡的文明进程.很少有人意识到,区块链的应用——Token可能是近100年来最伟大的制度创新,超越股份制,并将是『债券』之后最重要最主流的交易品种,没 ...
- 下一个时代,对话即平台 —— 开始使用Bot Framework和Cognitive Service来打造你的智能对话服务
在16年3月30号微软的全球开发者大会Build上发布了Bot Framework,微软认为下一个big thing是Conversation as a Platform,简称CaaP,中文应该叫做& ...
- 【深度学习与神经网络】深度学习的下一个热点——GANs将改变世界
本文作者 Nikolai Yakovenko 毕业于哥伦比亚大学,目前是 Google 的工程师,致力于构建人工智能系统,专注于语言处理.文本分类.解析与生成. 生成式对抗网络-简称GANs-将成为深 ...
- 为什么下一个十年的主战场在 Serverless?
作者 | 不瞋 阿里云 Serverless 负责人 "唯有超越,才能让我们走下去." 这是不瞋在阿里的第十年.从 2010 年加入阿里云,不瞋参与了阿里云飞天分布式系统的研发,历 ...
随机推荐
- APP测试功能点总结
1.功能性测试: ——根据产品需求文档编写测试用例. ——软件设计文档编写用例.注意:就是根据产品需求文档编写测试用例而进行测试. 2.兼容性测试: ——android版本的兼容性 ——手机分 ...
- java 框架收藏
一.java 异步非阻塞编程框架 1.Spring Webflux 2.Vert.x 3.Ratpack 4.smart-socket 国产异步框架 二.微服务框架 1.Jboot :专为大型分布式项 ...
- oracle 分页其实一个子查询就好了,没理解的自然只能见样学样
.首先rownum是一个查询缓存级别的东西,所以以下写法是错误的 ; 因为rn其实不是student表的内容,看做一个缓存编号就好 但是有些人不服了,加个a.rn<= ;结果还是不行,这下相信了 ...
- 如何查看服务器(linux系统)当前的负载信息(转)
如何查看服务器当前的负载信息http://www.flybaaa.com/help 网吧内突然很卡,这个情况我相信大家都有遇见过,但是通过什么方法来排查是否linux服务器的负载过大导致的这个问题呢? ...
- R语言中的四类统计分布函数
R语言中提供了四类有关统计分布的函数(密度函数,累计分布函数,分位函数,随机数函数).分别在代表该分布的R函数前加上相应前缀获得(d,p,q,r).如: 1)正态分布的函数是norm,命令dnorm( ...
- cxf的一些使用说明
/** * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agree ...
- Modelsim设置数据以模拟波形显示
选中希望以模拟波形显示的信号,右击选择format—>Analog(automatic) 如果你的数据是用无符号数表示一个完整的波形的,那么可能显示出来的波形样子是下面的样子,不过不要紧,这是因 ...
- 阿里杨传辉的访问节选(oceanbase)
皮皮(Q4): OceanBase第一个应用是收藏夹.最近,听说支付宝交易也用到了OceanBase.能否结合阿里的应用谈谈OceanBase的优势. 杨传辉(A4):相比传统的关系数据库,谈及Oce ...
- Linq使用中的ToList注意事项
在使用Linq时,如果查询逻辑太复杂,可以拆分为多个Linq查询,下一个Linq在上一个Linq查询的结果上继续操作,这样逻辑清晰,又不会出错.但在使用ToList的时候需要注意,最常见碰到的错误是: ...
- Hadoop HDFS HA启动出现两个StandBy NameNode
可能是zkfc服务没有启动,正确的流程如下: 1.在nn001上格式化zkfc sudo -u hdfs hdfs zkfc -formatZK 2.在三个(或以上)节点上启动journalnode ...