作者|William Vorhies 译者|姚佳灵 编辑|Debra

导读:IBM 的沃森问答机(Question Answering Machine,简称 QAM),因 2011 年参加综艺节目《危险边缘》 获胜而出名,本应该带来医疗保健领域巨大的回报。但是,相反,IBM 及其沃森医疗保健客户正在迅速削减这些基本上没有获得回报的项目。沃森是机器学习 /AI 领域中第一个开箱即用的商业应用程序。它已经过时了吗?

感谢 IBM 引领我们创造了这么多个 AI 第一,包括:

  • 1996 年 IBM 的深蓝(Deep Blue)创造了电脑首次击败顶尖人类选手的历史。

  • 2011 年沃森参加综艺节目《危险边缘》获胜。

我确信,还有很多 IBM 创造的令人瞩目的第一我没有提到,但是,由于我们今天要讲的是沃森,其他的我们就不多讲了。

沃森的非凡之处是,在 2011 年,我们认为是 AI 的这些技能:图像和视频处理、面部识别、文本和语音处理、棋类活动之外的游戏、自动驾驶汽车,所有这些是如此的原始,它们还没有接近商用,并且也不会在几年内就投入商用。

时间快进到 2013 年,IBM 宣布,医疗保健,特别是癌症诊断和治疗方案的推荐将成为沃森的王牌。

据报道,到 2015 年为止,IBM 在沃森上的投入已经超过了 150 亿美元。

2018 年之前的两年里,媒体报道了很多关于医院缩减规模或放弃沃森的消息。在 2017 年,著名的 MD Anderson 提出了他们的项目。纽约斯隆凯特琳癌症中心自 2012 年以来一直在帮助训练沃森,但是没有用在他们的病人身上。IBM 自己也宣布了缩减在沃森医疗保健项目上工作的员工规模。

尽管沃森是第一个开箱即用的大型 AI 应用程序,所有跟它的缺点有关的新闻不禁让我们产生了疑问,沃森是否会成为在这个 AI 不断增长、快速前行的世界中第一个被抛弃的 AI 技术?

沃森到底是什么?

在我们回答这个问题前,我们必须弄清楚沃森到底是什么。问题是,在 2011 年沃森赢得比赛后,IBM 很快地把几乎每个引入的 AI 的版本都命名为沃森。它扩展到基于 CNN 的图像处理,甚至是用于建模的分析平台,这些都跟最初的沃森没有丝毫关系,或者说,现在的沃森在为此背锅。

沃森是问答机

沃森是一个问答机系统(Question Answering Machine,简称 QAM),医院在用的沃森问答机与那台赢得比赛的沃森几乎一模一样。也即,利用自然语言处理(NLP)文本输入和输出,沃森问答机搜索大量的知识,并提供最可能正确的答案。

在问答机和简单搜索之间有个重要的区别。

  • 在普通的搜索中,通常会返回好几页的链接,通过这些链接 可能找到答案。

  • 对于问答机,要求返回一个答案,该答案是通过内部模型评分得到的最能代表 正确答案的那一个。

正如数据科学家都心知肚明(也许在使用沃森的医生不一样),所有的模型都会出错,包括假阴性和假阳性。在癌症检查中,这尤其成问题。我们不希望成为被诊断为假阴性的患者,因为癌症的症状被忽略了;也不希望成为被错误治疗癌症的健康人。

医生们所经历的有点微妙。正如预期的那样,沃森在诊断或治疗上的建议大多数是正确的。但是,沃森偶尔会给出明显错误的建议或不恰当的治疗方案。

在推出沃森后的乐观期,医院和 IBM 都认为这是个有价值的第二观点的来源。然而,随着时间的流逝,美国的医生们发现,他们需要不断地仔细检查沃森的建议,并且,沃森没有告诉他们那些他们所不知道的事。

在过去的几年中,IBM 也跟沃森合作,并推出了基因组学独特的版本,意在根据病患的基因标记识别治疗方案。根据一些零散的轶事报道,沃森基因组版本偶尔会发现医生们没有预料到的东西。在海外有限的使用中,这些报道更为常见。但是,在美国,据报道,IBM 对每位接受该检查的病患收取 200 到 1000 美元的费用,没有为医院带来任何财务上的收入。

最重要的是,用于癌症和在其他医疗保健应用中的沃森看起来要灭绝了。

为什么会发生这样的事?

这可能只是实施中的一个缺陷。

也可能表明 AI 问答机的未来已经到了极限,并且,将来不会成为 AI 的一个主要组成部分。

也可能两者兼而有之。

为了探索这个问题,我们需要回顾一下问答机的工作原理和如何设置它。

问答机的基本原理

自然语言处理(Natural Language Processing,简称 NLP):NLP 是问答机的核心。NLP 一直在稳步地进步,能够解释一串单词所隐藏的含义,并解释这些词的语境。(如:“I’m feeling blue”我心情不好,“find the boat with the red bow”找到有红蝴蝶结的船)。RNN 利用它们不断增长的能力来分析字符串或词序,无论是输入还是输出,都是改进的主要驱动力。因此,问答机能够接受对话式查询(如,这是我的病人的病历以及目前的状况,最佳的行动方案是什么),并且提供文本输出。

访问受管理的知识库: 该过程首先加载大量的结构化和非结构化源数据,这些数据跟要考虑的领域有关(即,癌症诊断、医疗保健利用管理、法律、社交媒体的看法)。这个知识库是人类管理的,并且必须由人类进行不断地更新以移除那些不再准确的源文件,或添加新的材料。

摄取: 像沃森这样的问答机随后开始对知识库构建索引,并对元数据进行初步探索以让其接下来的处理更有效率。问答机可能也会构建图形数据库附件以提供帮助。

初步训练: 问答机需要一种监督学习形式。数据科学家加载大量的问题和相应的回答,问答机从中学习归纳出哪些术语和习语一起出现,以及关于最有可能答案的逻辑核心。问答机不是简单地重复这些“正确的”样本答案,它们学会超越,并根据这些训练数据找出其他正确的答案。

假设和结论: 当问问答机一个问题的时候,它将解析该问题以发展出一系列潜在的意义或假设,并在支持它们的知识库中寻找证据。然后,对每个假设进行统计评估,以确定问答机是否正确,并把答案呈现给终端用户。

知识发现: 在一些应用中,多个回答或替换方案事实上可能是目标。这些有可能代表了人类之前从未想到过的事实和环境的组合,比如化学物质、药物、治疗方案、材料或 DNA 链的组合,可能代表其领域的新颖创新。在一些癌症应用中,沃森返回可能治疗方案的优先列表。

问题发生在哪里?

这不意味着要对每个用例进行法医研究,但是,我有强烈的预感,这里出了问题。像沃森这样的问答机非常耗费人力,远远超过我们目前在用的任何其他机器学习 /AI 应用。

加载所需的所有文档和数据以建立原始知识库,以及持续审查和去掉过时知识的需求,同时要跟上该领域的所有最新发现,这些都需要大量的人工。

在此基础上,还对搜索相关模型进行初步及持续的训练,其中的模型由人类生成的成对的问题和回答进行训练。

这是一个非常不同于我们已经习惯的 AI/ 机器学习实施模型。我怀疑,对于一个像癌症或一般的医疗保健这样的巨大且复杂的主题,在数据库的维护中,巨大的人力因素是一个致命弱点。

沃森有成功的例子吗?

我确信在某种情况下,知识体系会受到更多的限制,而且变化速度也变慢了。我们在 2016 年回顾沃森时,列出了 30 个不同的部署沃森的例子,其中包括:

Macys 部署了“Macy’s On Call”,这是一个移动 web 应用程序,点击沃森以允许消费者输入自然语言问题,这些问题都是关于每个商店独特的产品分类、服务和设施,并且消费者接收到对于该查询的定制回复。

VineSleuth 开发了其 Wine4.me 应用程序,根据感官科学和预测算法为消费者推荐红酒。该初创企业把沃森的语音分类器和翻译服务用于杂货店的售货亭。

希尔顿全球酒店集团(Hilton Worldwide) 利用沃森为“Connie”助力,“Connie”是酒店业第一个受沃森支持的机器人礼宾服务。“Connie”根据来自沃森和 WayBlazer 的领域知识,向客人介绍当地的旅游景点、餐饮推荐和酒店特色及设施。

Purple Forge 为加拿大的 Surrey 开发了基于 311 服务的沃森,用于回答市民关于政府服务的问题。(何时收集回收物品?)该应用程序能够回答 1 万多个问题,比人类更有效率,同时成本也更低。

前进的方向

这些例子的共同之处是,知识库非常有限,并且 / 或者变化缓慢。其次,也许更相关的是,随着聊天机器人爆发性地投入应用,这些更简单的面向客户的应用程序现在正在得到解决。因此,看起来,该市场的“低端”似乎受益于 NLP 借助聊天机器人的进步,或者,更常见的是不用沃森问答机。

在该市场的“高端”,知识库是非常庞大且迅速变化的。可以预见一个复杂的问答机假设 / 搜索算法能够结合以前没有结合的知识元素以创造独特的新见解。沃森在该领域面临着来自不同方法的复杂问题的竞争。

例如,人们希望结果是发现新的化学物质、材料、药物或 DNA 功能。尽管沃森仍然在这一领域有用武之地,但是,研究人员越来越倾向于使用较少人力的 CNN 和 RNN 来进行探索。这在生物领域尤其如此。

对于沃森来说,在这个连续统一体中的中间仍然有可能有个适合它的最佳位置,但是,这些机会看起来越来越渺茫,因为底层的聊天机器人和顶层的更高级技术限制了它。

也许现在还不是说问答机在 AI/ 机器学习领域没有一席之地的时候,但是,在设置和维护过程中那么高的人力需求就没有通过深度神经网络、强化学习和大量非人类计算能力来完成同样的工作那样有吸引力。

阅读英文原文:

https://www.datasciencecentral.com/profiles/blogs/watson-time-to-prune-the-ml-tree

https://mp.weixin.qq.com/s/j3Z8Pss6KKjRlQrSdU4y5Q

IBM沃森会成为第一个被抛弃的AI技术吗?的更多相关文章

  1. IBM的人工智能“沃森”首次确诊罕见白血病,只用了10分钟!

    患者为一名60岁的女性,最初根据诊断结果,显示她患了急髓白血病.但在经历各种疗法后,效果并不明显. 根据东大医学院研究人员Arinobu Tojo的说法,他们利用Watson系统来对此病人进行诊断.系 ...

  2. DataPipeline创始人&CEO 陈诚:沃森与AI

    引言:本文来自infoQ架构师电子月刊对DataPipeline创始人&CEO陈诚的约稿.陈诚,毕业于上海交大,留学于美国密西根大学,前Yelp大数据研发工程师,曾就职于美国Google.Ye ...

  3. 沃森Mysql数据库修复工具

    华信Mysql数据库修复程序是由北京华信数据恢复中心独立研发.主要针对Mysql数据库损坏的恢复. 本程序可用于因为各种误操作而导致数据丢失的恢复,以及因为断电.陈列损坏.硬盘坏道等各种原因导致数据库 ...

  4. 玩转PowerShell第一节——【后台任务处理】-技术&分享

    概述 相信大家对后台任务处理不陌生,比如.Net的后台线程处理,Java的线程处理等等. 而当我们用PowerShell这个强大的工具时怎么样开启后台任务呢,以及怎样处理这些任务呢,本篇将会告诉你Po ...

  5. 第一章 Java Web应用开发技术

    Java Web应用开发是基于JavaEE(JavaEnterprise Edition)框架的,而JavaEE是建立在Java平台上的企业级应用解决方案.JavaEES框架提供的Web开发技术主要支 ...

  6. 【深度学习大讲堂】首期第一讲:人工智能的ABCDE 第二部分:简谈当前AI技术与发展趋势

    (完)

  7. 2019 计蒜之道 初赛 第一场 商汤的AI伴游小精灵

    https://nanti.jisuanke.com/t/39260 根据题意我们可以知道  这是一个树 我们只需要找到出度最大的两个点就好了 如果包含根节点的话要-- 两个点相邻的话也要-- 数据很 ...

  8. Linux和云供应商Red Hat被IBM以34亿美元的价格收购

    导读 今天的主题包括IBM以340亿美元收购Red Hat,人性化是使人工智能成功的关键.两家公司于10月28日宣布,IBM正以340亿美元的价格收购Linux和云技术供应商Red Hat,以期改变云 ...

  9. 【用AI开挂的人生】5岁学编程,12岁进IBM

    " 跟普通孩子比起来,14岁少年Tanmay Bakshi身上有无数光环: 5岁开始对计算机感兴趣 9岁发布了第1个iOSAPP 12岁成为IBM沃森最年轻的程序员 现任IBM Watson ...

随机推荐

  1. Kali学习笔记32:Maltego、Exiftool

    有段时间没学Kali里面的工具了 以前做信息收集的时候呢,忘记了两个很强大的工具:Maltego.Exiftool 先来看看Maltego: 这个工具不仅可以方便地收集DNS信息等等,强大地地方还在于 ...

  2. Kali学习笔记13:操作系统识别

    为什么要扫描操作系统呢? 其实和上一篇博客:<服务扫描>类似,都是为了能够发现漏洞 发现什么漏洞? 不同的操作系统.相同操作系统不同版本,都存在着一些可以利用的漏洞 而且,不同的系统会默认 ...

  3. 【MySQL】存储emoji表情报错(Incorrect string value: '\xF0\x9F\x98\x82\xF0\x9F...')的解决方案

    Emoji表情字符现在在APP已经广泛支持了.但是MySQL的UTF8编码对Emoji字符的支持却不是那么好.所以我们经常会遇到这样的异常:   Java.sql.SQLException: Inco ...

  4. 解决Database returned an invalid datetime value. Are time zone definitions for your database installed?

    设定博客文章按照时间分层筛选出现问题 ret=Article.objects.filter(user=user).annotate(month=TruncMonth("create_time ...

  5. python应用-爬取猫眼电影top100

    import requests import re import json import time from requests.exceptions import RequestException d ...

  6. c++多继承多态

    C++多继承多态的实现 如果一个类中存在虚函数,在声明类的对象时,编译器就会给该对象生成一个虚函数指针,该虚函数指针指向该类对应的虚函数表. 多态的实现是因为使用了一种动态绑定的机制,在编译期间不确定 ...

  7. equalsIgnoreCase()和equals()的区别

    String a="ABC";a.equals("abc")为false,a.equalsIgnoreCase("abc")为true;eq ...

  8. java提高(8)---ArrayList源码

    ArrayList源码 一.定义 public class ArrayList<E> extends AbstractList<E> implements List<E& ...

  9. java遍历Map

    //方法一 Set<String> keys = map.keySet(); for (String key:keys) { System.out.println(key+",& ...

  10. SpringCloud入门之YAML格式文件规范学习

    1. 认识 YAML YAML(发音 /ˈjæməl/)是一个类似 XML.JSON 的数据序列化语言.其强调以数据为中心,旨在方便人类使用:并且适用于日常常见任务的现代编程语言.因而 YAML 本身 ...