TOP100summit 2017:亚马逊Echo音箱能够语音识人,华人工程师揭秘设计原理
本文编辑:Cynthia
2017年,人工智能的消费产品落地聚焦在了智能音箱上,谷歌、亚马逊纷纷推出智能音箱产品,国内的阿里巴巴推出天猫精灵,小米推出小米AI音箱。智能音箱通过语音可以发出指令,未来可能成为智能家居的入口,通过语音控制家里的其他智能设备。
几个月前谷歌的语音识别应用推出支持个性化语音识别功能,而本周三,也就是10月11日,亚马逊的Echo音箱也具备了这项功能。
当不同的人对着音箱说话时,可以自动识别身份,提供比如个人专属的音乐播放列表、个性化购物等功能。总之,可以通过声音来识别人,让语音控制更进一步。
亚马逊Echo音箱背后是亚马逊的Alexa智能语音技术,陈亚是一位华人工程师,是亚马逊Alexa机器学习团队的资深工程师,负责语音识别、语义理解模型的搭建及优化。关于Alexa的技术内涵壹佰案例特意与陈亚进行了交流。
语音识人的技术原理
如果在很多人的空间里,让Alexa知道是谁在说话,使用的是铆钉语音检测的思路,开始通过Alexa来唤醒系统,使用一个RNN从中提取锚定嵌入,记录语音特征,接下来用另一个RNN从后续的请求语句中提取语音特征,基于此得到一个端点决策。
陈亚介绍,Alexa是首个通过语音指令驱动的AI语音助理软件,只需要呼叫“Aleca”,就可以对已经连接数百个应用的Alexa下达工作指令,比如播放音乐、查找资料、启动其他智能设备或者购物等。
现在Alexa并不只是一个语音识别工具,已经变成了一个很成熟的操作系统,未来有可能取消传统的手机屏幕,通过语音就可以进行操作。
Alexa的深度学习技术原理
Alexa的开发进行了大规模的深度学习,一个人成长到16岁耳朵听声音的时间大概只有14016小时,而Alexa的深度学习是将几千个小时的真实语音训练数据存储到S3中,使用EC2云上的分布式GPU集群来训练深度学习模型。
在训练模型方面,Alexa使用几个逼近算法减少更新规模,随着GPU线程的增加,训练速度也会加快,每一秒可以处理大约90分钟的语音。人耳16年可以听1.4万个小时的语音,而Alexa使用3小时就可以完成。
Alexa的语音识别系统主要包括信号处理、声学模型、解码器以及后处理等4大模块,首先将收集的声音进行信号处理,再将语音信号转化到频域,从10毫秒的语音中提取特征向量提供给声学模型,声学模型负责把音频分成不同的音素,解码器可以得出概率最高的一串词串,经过后处理把单词组合成容易读取的文本。
Alexa与其他语音识别应用的优势
陈亚介绍到,Alexa之所以能够占据终端市场70%的市场份额,是因为亚马逊客户至上的文化信仰。Alexa能够取得成功,是因为从产品设计到开发管理模式等方面都坚持客户至上的原则,进行用户体验革新,降低智能家居门槛,建立Alexa生态。
即将在11月9日开幕的第六届TOP100全球软件案例研究峰会上,陈亚将以分享嘉宾的身份出席,从产品设计的角度分享亚马逊用户至上理念引导的产品设计思路,以及亚马逊对人工智能和机器学习的探索经验。
更多TOP100案例信息及日程请前往[官网]查阅。4天时间集中分享2017年最值得学习的100个研发案例实践。本平台共送出10张开幕式单天免费体验票,数量有限,先到先得。
TOP100summit 2017:亚马逊Echo音箱能够语音识人,华人工程师揭秘设计原理的更多相关文章
- 亚马逊CEO贝索斯致股东信:阐述公司未来计划
亚马逊CEO 杰夫·贝索斯(Jeff Bezos)今天发布年度股东信, 详细描述了亚马逊的产品.服务和未来计划,当然,信中并没有任何的硬数据,比如说亚马逊Kindle的销量等等.但这封信也包括一些颇令 ...
- RBC:Echo设备2020年可为亚马逊贡献100亿美元收入
BI 中文站 12 月 22 日报道 加拿大皇家银行资本市场(RBC Capital Markets)分析师马克-马哈尼(Mark Mahaney)表示,亚马逊是首批将智能音箱引进主流受众的公司之一, ...
- 亚马逊拟斥资15亿美元建航空货运中心 - Amazon to spend $1.49 bln on air cargo hub, fans talk of bigger ambitions - ReutersFebruary 1, 2017
2月1日消息,亚马逊本周二宣布将在肯塔基州开建其第一个航空货运中心,以应对高速增长的航空货运需求.亚马逊预计,该项目将带来2000个工作岗位. 据悉,该项计划总投入约为15亿美元,亚马逊或可从当地政府 ...
- 微软、谷歌、亚马逊、Facebook等硅谷大厂91个开源软件盘点(附下载地址)
开源软件中有大量专家构建的代码,大大节省了开发人员的时间和成本,热衷于开源的大厂们总是能够带给我们新的惊喜.2016年9月GitHub报告显示,GitHub已经有超过 520 万的用户和超 30 万的 ...
- Google、微软、Linkedln、Uber、亚马逊等15+海外技术专家聚首2018TOP100Summit
11月30日-12月3日,由msup主办的第七届全球软件案例研究峰会(以下简称为TOP100Summit)将在北京国家会议中心举办.本届峰会以“释放AI生产力,让组织向智能化演进”作为开幕式主题, 4 ...
- 为什么亚马逊云计算中的DNS服务叫Route53?
最近在用亚马逊的云计算服务,看到它的DNS服务的名字叫做"Route 53".这个名字让我很好奇,为什么叫"Route 53"呢?有什么特殊含义? 看到了这个Q ...
- 亚马逊AWS EC2云实例AMI安装LNMP环境(3)——Mysql5.5
概括:这里选择亚马逊EC2的Linux AMI实例,该Linux服务器是亚马逊预配置的Linux环境,内置多个YUM源,属于亚马逊首推的稳定Linux服务器.默认登录用户名为ec2-user,执行ro ...
- python 脚本开发实战-当当亚马逊图书采集器转淘宝数据包
开发环境python2.7.9 os:win-xp exe打包工具pyinstaller 界面tkinter ============================================= ...
- [cnblog新闻]阿里的营业利润3倍于亚马逊,但为何市值只是亚马逊的一半?
阿里的营业利润3倍于亚马逊,但为何市值只是亚马逊的一半? 投递人 itwriter 发布于 2019-01-26 16:52 评论(0) 有688人阅读 原文链接 [收藏] « » http://ww ...
随机推荐
- [SLAM] 02. Some basic algorithms of 3D reconstruction
链接:http://www.zhihu.com/question/29885222/answer/100043031 三维重建 3D reconstruction的一个算法思路介绍,帮助理解 首先一切 ...
- C# IsBackground作用
https://blog.csdn.net/snakorse/article/details/43888847 要点: 1.当在主线程中创建了一个线程,那么该线程的IsBackground默认是设置为 ...
- C#静态构造函数调用机制
https://blog.csdn.net/cjolj/article/details/56329230 若一个类中有静态构造函数,在首次实例化该类或任何的静态成员被引用时,.NET自动调用静态构造函 ...
- 8 -- 深入使用Spring -- 3...1 Resource实现类ServletContextResource
8.3.1 Resource实现类------ServletContextResource:访问相对于ServletContext路径下的资源的实现类. 4.访问应用相关资源 Spring提供了Ser ...
- Go之对象拷贝
这里interface{}就相当于c#,java中的object, boy := util.Boy{util.Person{"Eric", 19, "boy"} ...
- 第7章 Ajax数据爬取
Ajax 简介 Ajax 分析方法 Ajax 结果提取
- J2EE学习篇之--Struts1详解
今天来看一下Struts1的相关知识,其实Struts现在是出名的,每个Web开发者都会知道的,也是现在比较流行的框架,下面就来看一下我们为什么要用Struts框架呢? 摘要 1.建立在mvc这种好的 ...
- 推荐系统之基于图的推荐:基于随机游走的PersonalRank算法
转自http://blog.csdn.net/sinat_33741547/article/details/53002524 一 基本概念 基于图的模型是推荐系统中相当重要的一种方法,以下内容的基本思 ...
- IT零起步-CentOS6.4部署OpenVPN服务器
OpenVPN是一个用于创建虚拟专用网络加密通道的软件包,实现二/三层的基于隧道的VPN.最早由James Yonan编写.OpenVPN允许创建的VPN使用公开密钥.数字证书.或者用户名/密码来进行 ...
- es6 - class的学习
http://es6.ruanyifeng.com/#docs/class:class Person { constructor{ //构造函数,里边放不被继承的私有属性和方法 this.proper ...