语音交互事关未来,国内外已经不少公司在抢蛋糕了,大公司收购、投资、合作不断,就可见一斑。目前,基本上所有的巨头都有涉足。

苹果收购 Siri、Novauris,组建基于神经网络算法的语音识别团队


2014 年 7 月,有消息称,苹果正在联系多位语音识别技术的专家,正在招聘经理、小组负责人、研究员,很可能将成立一支强大的语音识别团队,并最终取代现在的 Siri 技术服务商 Nuance。过去几年中,苹果招聘了多名此前供职于 Nuance 的的高层次语音技术研究员,包括前研究副总裁拉里·吉利克 (Larry Gillick)、Siri 的项目经理贡纳尔·艾弗曼(Gunnar Evermann)、微软语音识别项目高管亚历克斯·阿赛洛(Alex Acero)。

在 2013 年,苹果收购了自动语音识别公司 Novauris Technologies。Novauris 是英国研究机构 Dragon Systems 旗下的附属公司,以语音听写识别著称,成立于 2012 年。当然,怎么能忘了最著名的那笔收购呢,2010 年 4 月,以 1.5~2.5 亿美元收购了 Siri。

Google 收购多项语音识别技术专利、SayNow 、Phonetic Arts


Google 在 2014 年收购了 SR Tech Group 的多项语音识别相关的专利,其中包括“ 搜索引擎语音界面” 和“ 修改、更新语音识别项目系统”的专利。

Google 一直致力于投资语音搜索技术,以期与苹果公司的 Siri 展开竞争。2011 年,Google收购语音通信技术公司SayNow 和语音合成技术 Phonetic Arts。 其中,SayNow 创建于 2005 年,可以把语音通信、点对点对话、以及群组通话和 社交应用整合在一起,支持的设备包括 PC 浏览器、智能手机乃至座机。被收购时,有 1500 万用户,旗下产品包括 SayNow Phone,SayNow 广播,Big Call 以及 Chit Chat 等。

Facebook 收购 Wit.ai 和 Mobile Technologies


语音交互解决方案服务商 Wit.ai 要做的就是重写互联网的语音层,简单地在第三方 App 中加入几行代码来为它生成一个语音交互界面,就能把语言转化成可以操作的数据。正如移动支付公司 Stripe 通过几行代码就为网站解决了线上支付问题一样。Wit.ai 称,它比 Siri 更灵敏精确,不需要开发者先期投资,或训练数据集,而且可以应用在移动应用程序 (iOS、Android 等平台)、穿戴设备和机器人以及几乎任何你可以想到的智能设备。被收购时,Wit.ai 成立才 18 个月,吸引了 6000 多名开发者,创建的应用超过了数百个。此次收购有助于提高 Facebook 整体对自然语言的理解能力。

除了 Wit.ai,Facebook 还在 2013 年收购了语音识别公司 Mobile Technologies。MT 创建于 2001 年,在 2009 年推出了 Jibbigo 应用,允许用户在 25 种语言中进行选择,使用一种语言进行语音片段录制或文本输入,然后将翻译显示在屏幕上,根据你选择的语言大声读出来。

Amazon收购语 Yap、Evi、Ivona


2011 年,Amazon收购语音识别公司Yap。Yap 成立于 2006 年,主要提供语音转文本服务,代表应用是 Yap 语音邮件。利用 Yap 的技术亚马逊建立自己的语音技术平台,服务于亚马逊的网上搜索和客户服务等领域。

2012 年,Amazon 收购语音技术公司 Evi。Evi 是一家应该创业公司,原名 True Knowledge,在获得了 Nuance 语音识别技术的授权后,基于自主的自然语言搜索引擎开发了一款与苹果 Siri 类似的应用。

2013 年,Amazon 收购语音技术公司 Ivona Software。Ivona 是一家波兰公司,是 Nuance 的竞争对手,主要做文本语音转换,被收购时支持 17 种语言 44 种声音。

英特尔收购语音识别技术公司 Indisys


2013 年,英特尔收购了语音识别技术公司 Indisys。这是一家西班牙公司,但自称一直在做多语音。在计算语言学、人工智能、认知科学和机器学习领域有研究,不少西班牙公司都采购了他们家的技术。此外,他们还开发了与苹果 Siri 相似的助手界面。

三星或收购语音识别软件商 Nuance


关于三星和 Nuance 的绯闻已经传了段时间。Nuance 的语音识别技术在智能手机、电视和 GPS 导航设备上都有广泛应用,比如苹果的 Siri 就是用的它的技术;其他一些企业级市场也有需要用到语音识别的地方,比如医院里的电子病历业务,医生直接口述就能生成电子病历。2013 年 9 月份时,Nuance 还同三星达成合作。

雅虎收购 SkyPhrase,牵手 Robin Labs


2013 年 12 月,雅虎收购了自然语言处理技术初创公司 SkyPhrase。Gmail 和 Twitter 的相关技术支持就是 SkyPhrase 提供的,允许用户跟机器说“人话”得到个性化的搜索结果。比如“NANA 发的带图微博”,或者“Jane 发给我的包含照片的电子邮件”——这样复杂的信息 Siri 是理解不动的。SkyPhrase 还开发了两款应用,其中一款能让用户查看梦幻足球的比分统计数据,另一款应用与 Google Analytics 整合发挥作用。

为了推雅虎语音助手,雅虎还找到了合作伙伴Robin Labs,后者主要做自然语言识别和导航。除开发自己的私人助手的导航应用外,现在它还为客户提供语音助手白标产品的开发。”也就是说,理论上讲,每个应用都可以添加一个特定的语音助手模块。既然雅虎语音助手其实是 Robin Labs 开发的,那它会被收购么?

其实,除了这些大公司和被他们收购的小公司,还有几家初创公司做的也挺有意思。比如,下面这两家。

全球首个通过语音来识别情绪的公司 Beyond Verbal


Beyond Verbal 是一家以色列公司,成立于 2012 年,在情绪识别领域一直领先。Beyond Verbal 系统创建的算法可以通过识别音域变化,从而分析出像愤怒、焦虑、幸福或满足等情绪,心情、态度的细微差别也能被识别到。Beyond Verbal 的情绪识别系统可以分析出 11 个类别, 400 个复杂情绪的变量。

2013 年 1 月,他们开发的情绪识别 app moodies 在 iOS 平台发布;2014 年 8 月,他们开发了 moodies 的安卓版。2013 年 5 月,获得了 280 万美元融资;2013 年 7 月,又获得了 100 万追加融资。2014 年 9 月,又追加了 330 万美元种子融资。

在 2014 年耶路撒冷召开的 TEDMEDLive 上,就引入了 Beyond Verbal 的技术来对所有与会人员的情绪进行分析,进而总结整个会议的整体反馈情况。

英国语音识别初创企业 EI


英国的初创企业 EI Technologies 也是一家做语音情绪识别的公司,可以分析人声的音调,监控用户的情绪。之前从孵化器 Wayra London 和英国政府的 Technology Strategy Board 拿到了 15 万英镑的种子期融资。

目前系统可识别 5 种基本情绪:高兴、悲伤、害怕、愤怒及无感情。识别的准确率约为 70-80% 左右,这个数字要高于人类 60% 的平均水平。而受过训练的心理学家的判断准确率约为 70%,从这些数据来看,EI 的算法准确率已经非常可观。其未来目标是进一步提高到 80-90%。

通过识别并恰当响应语言内容和情绪来增强自然语言处理算法似乎是人工智能系统的下一步发展方向。《银翼杀手》里面的复制人的致命缺陷正是缺乏“移情(empathy)”能力。现在这三家公司的技术正帮助机器朝着具备“移情”能力迈出一小步—首先学会感受人类的情绪。不过这也是个庞大又复杂的工程。

自然语言处理哪家强?【36kr】的更多相关文章

  1. PAT 1032. 挖掘机技术哪家强(20)

    为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过105的正整数N,即参赛人数.随后N行,每行给出一位 ...

  2. PAT乙级 1032. 挖掘机技术哪家强(20)

    1032. 挖掘机技术哪家强(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 为了用事实说明挖掘机技术到底 ...

  3. PAT (Basic Level) Practise:1032. 挖掘机技术哪家强

    [题目链接] 为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过105的正整数N,即参赛人数.随后N行 ...

  4. .NET ORM 哪家强

    ORM到底哪家强? 很多人都想知道这个问题,自已也没测试过,只能道听途说. 闲的无聊就将几个ORM拿出来比一比,假如怀疑测试代码有问题可以将它下载下来慢慢研究. 参赛ORM 1.SqlSugar:是一 ...

  5. 挖掘机技术哪家强(c++实现)

    描述:为了用事实说明挖掘机技术到底哪家强,组织一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入:输入在第1行给出不超过105的正整数N,即参赛人数.随后N行,每行给出一位参赛者的 ...

  6. PAT-乙级-1032. 挖掘机技术哪家强(20)

    1032. 挖掘机技术哪家强(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 为了用事实说明挖掘机技术到底 ...

  7. exe打包发行哪家强

    exe打包发行哪家强,我推荐Advanced Installer11.0: 该有的都有了,这是网盘地址:http://pan.baidu.com/s/1geRDPIz

  8. 跨站数据请求哪家强——青出于蓝的jsonp

    /* * 跨站数据请求哪家强--青出于蓝的jsonp数据格式 * @author gj * @date 2017-09-15 */ 先哲有云"青,取之于蓝,而青于蓝:冰,水为之,而寒于水&q ...

  9. 【安全狗SRC】抗D设备哪家强?你来!大佬告诉你答案

    上周,安全狗SRC联合SRC部落,携手推出了爆款话题:传统抗D设备 vs 新兴CDN抗D:抗D效果哪个好? 一经发布简直好评如潮,热评无数,四方雷动(?)原帖在此,错过的吃瓜表哥们可以再围观一下~ht ...

随机推荐

  1. mixpanel实验教程(1)

    一.关于 mixpanel 这个我不想多说,不明确请看官方手冊:https://mixpanel.com/help/reference/ 二.注冊 mixpanel.com 是一个商业机构.它的用户分 ...

  2. Android 模拟器设置

    这几个图标你应该是没有见过的,我来简单为你介绍下.最左边的图标其实你已经比较熟悉了,就是你睡觉前使用过的Android SDK管理器,点击它和点击SDK Manager效果是一样的.中间的图标是用来开 ...

  3. 让DELPHI自带的richedit控件显示图片

    让DELPHI自带的richedit控件显示图片 unit RichEx; { 2005-03-04 LiChengbin Added: Insert bitmap or gif into RichE ...

  4. UINavigationController 、UINavigationBar 、UINavigationItem 超清晰直观详解(扩展)

    ios开发中如何隐藏各种bar 状态条Status Bar [UIApplication sharedApplication].statusBarHidden = YES; 或者 // iOS3.2+ ...

  5. git 删除远程分支和本地分支

    删除远程分支和本地分支 https://www.cnblogs.com/luosongchao/p/3408365.html 将远程git仓库里的指定分支拉取到本地(本地不存在的分支) https:/ ...

  6. Android之文件搜索工具类

    /** * @detail 搜索sdcard文件 * @param 需要进行文件搜索的目录 * @param 过滤搜索文件类型 * */ private void search(File file, ...

  7. 开源项目DataTimePicker实现时间和日期的选择

       这个开源项目是模仿Google官方的time选择器做的,是否漂亮.让我爱不释手,真心喜欢.很有幸和大家一起分享下,那么话不多说开始讲解. 开源项目地址:https://github.com/fl ...

  8. 同一个ImageView根据xml文件来显示不同的图片--level-list

    感谢:http://blog.sina.com.cn/s/blog_6111ce890100psq9.html 有时候,我们为了在一个ImageView中显示不同的图片,平时往往会使用: if (条件 ...

  9. java中 列表,集合,数组之间的转换

    java中 列表,集合,数组之间的转换 java中 列表,集合,数组之间的转换 java中 列表,集合,数组之间的转换 List和Set都是接口,它们继承Collection(集合),集合里面任何数据 ...

  10. H2:开源内存数据库引擎

    本资源由 伯乐在线 - 刘立华 整理 H2是一个开源的内存数据库.Java编写.快速.小巧(1.5MB jar包)还提供了Web控制台管理数据库内容. 主要功能 非常快速的数据库引擎. 开源. Jav ...