Torque:轻应用背后的大蓄势 微软语音技术厚积薄发

Torque,为中国用户而来
此前,“微软车库”公开发布了一系列小而美的产品,它们全部由具有“极客创新”精神的微软员工在工作之外的时间构思和开发。Torque就是其中一款备受关注的人工智能类产品,它针对安卓平台开发,基于微软语音技术和必应大数据引擎,以小巧创新的界面为用户提供安卓手机和安卓智能手表上的革命性交互体验。用户在不切换当前应用程序的情境下,仅凭单手摇晃手机或轻扭佩戴有智能手表的手腕就可以立刻启动Torque语音交互界面。是不是像举手提问一样便捷?用户在输入语音指令后,就可马上获得答案——包括网络搜索、打电话、发短信、记笔记、设闹钟等常见操作。
可以说,Torque是一款化繁为简的产品。仅凭手势动作和语音输入,它就可以帮你打点好一切。当你在用手机浏览网页或阅读邮件时,需要查询资料,Torque能在不切换当前邮件界面的情况下,仅摇晃一下手机,就可以呼唤出移动搜索获取答案。当你在车来人往的街头,双手被刚刚逛街购买的“战利品”所占据时,轻轻扭动手腕,Torque就能轻松帮你找到周围适合歇脚的咖啡馆。
Torque仅摇晃一下就可智能搜索、查血天气以及地点等Torque的最初版本由微软杰出工程师、语音技术专家黄学东和他的同事王嘉平、吴凌峰和熊炜开发完成。依托于微软语音技术20多年的积累,完成开发总共用了不到三个月的时间。Torque在英文中的意思是“扭矩”,将这款产品以Torque命名和talk谐音,四位开发团队的成员也是希望借此强调其轻轻扭动手腕就可以启动语音搜索的这项特性。采用了先进的深度机器学习算法和堪称世界一流的语音识别准确率,也是Torque带来了更为流畅的用户体验。
黄学东和他的同事王嘉平、吴凌峰和熊炜为使广大的中国用户也可以体验Torque的单手操作带来的便捷和高效,现在Torque中文版在微软(亚洲)互联网工程院首席研发主管杜奕瑾和同事的努力下,带着满满的诚意来到了中文用户的面前,期待得到大家的关注和试用反馈。Torque中文版基于必应搜索的中日韩大数据,包含更为精准的地理位置信息,不仅整合了微软人工智能技术针对于中文的个性化、简洁的回答,而且对于中文的方言和中英夹杂使用的特殊习惯都能应对自如。
二十年技术积累,语音识别从幕后走到台前
不久前的Windows
10发布会吸引了全球亿万观众的眼球。在这场低调而又充满惊喜的发布会上,微软不仅正式揭开了Windows
10这款众人翘首以盼的新一代全平台操作系统的神秘面纱,还出人意料地展示了令业界眼前一亮的两款产品:84英寸4K
触摸屏Surface
Hub和全息计算机HoloLens。从这些产品中,我们不仅看到了微软拥抱移动互联网的决心和行动力,也可以察觉到一个新的趋势:一个语音交互的时代正向我们款款而来,语音技术从幕后逐渐走到了台前,从小众技术渐渐转入主流应用。深入集成到Windows10中的Cortana让用户只要动动嘴就能轻松打理一切;而掀起科技圈热议的HoloLens就更离不开语音识别技术的鼎力相助了。
Windows10系统中的Cortana
以微软研究院为大本营,微软在语音识别领域已经开展了长达二十余年的研究,积累了丰富的研究成果和突破。这次的Torque便是微软将这些研究成果快速集成和转化成产品的又一个佐证。说到Torque,黄学东是一个不得不提的人物。作为微软的杰出工程师,黄学东现如今不仅担任微软公司的首席语音科学家还同时领导微软研究院工程技术研发团队,全面负责微软语音技术和人工智能技术的研发和产品转化工作。1993年,在卡耐基梅隆大学取得语音识别领域丰硕成果的黄学东以语音技术专家的身份加入微软,受比尔∙盖茨任命负责组建了微软第一支语音识别研发团队。两年后,语音识别的SpeechAPI就被成功第一次集成到了Window
95操作系统中。同一年,独具慧眼的黄学东将当时任职于苹果公司的语音技术专家洪小文招入麾下,成为微软自然交互服务部门的创始成员和架构师。两位又于1998年共同参与了微软亚洲研究院的前身,微软中国研究院的成立。如今,洪小文已经是微软亚太研发集团主席、微软亚洲研究院院长,全面负责微软在亚太地区的科研及产品开发工作,以及与中国及亚太地区学术界的合作。
在加入微软后的长达10年时间里,黄学东一直不遗余力地推进语音技术的发展以及促进技术向产品的转化。2004年,成功实现了微软语音平台全面构建的黄学东将目光投向了更远处,开始担任微软研究院产品孵化、内部创新的总经理,以期将研究院的精尖科研技术快速带入市场并服务广大用户。而后,黄学东投身于一场声势浩大的内部创新之旅,进入搜索这一全新的领域,开始担任必应搜索的首席架构师,负责下一代网络搜索技术的研发。2014年末,受公司任命,离开语音领域10年的黄学东重新回到微软研究院,开始全面负责微软语音技术的研发。Cortana和SkypeTranslator这两款被寄予厚望的产品,其核心的语音技术目前正由黄学东领导的研究院研发团队和相应地产品团队紧密地合作迭代着。
回过头来看黄学东的微软20年之旅,Torque这款小产品恰如他过往旅程的一个缩影——语音识别+移动搜索+产品创新,这正是黄学东在微软所走过的20年。而与20年前不同的是,语音如今已走到了人们的视野中心,逐渐成为人机交互的主流方式。Torque的推出对黄学东和微软来说有着特殊的意义:这是一种全新的移动搜索的方式,我们无法闭门造车,预测用户对其的认可度。验证它最好的方法就是将其尽快地投入市场。这一点也正体现了微软的文化演进——鼓励员工大胆尝试,不惧失败,不在应用平台上设限,将产品尽快地交付到用户手中并获得用户反馈作为检验其有效性的关键所在。
一个全面开放、充满创新活力的微软
2012年至今,从微软研究院创始人Rick
Rashid在二十一世纪的计算大会上公开展示实时语音翻译技术开始,到Cortana,再到前不久的Skype
Translator,基于微软语音技术的产品给用户一次次带来惊喜。但与以上基于微软操作系统或产品的Cortana和Skype
Translator不同的是,Torque为安卓手机和手表量身打造。黄学东希望通过安卓平台,Torque能被更多的用户使用。为非微软操作系统的用户提供服务,这已经不是耸人听闻的事了。2014年,我们见证了一个全新的微软的诞生。在Satya
Nadella上任后,微软开启了全面开放的新时代,在“移动为先、云为先”的战略下不断推出跨平台的软件和服务,给用户带来惊喜。就如Satya所说的——只要是有屏幕存在的地方,不管采用的是什么系统,都将有微软的服务——黄学东希望在安卓这个拥有广泛用户的平台上,作为创新产品的Torque能服务大众,快速获得用户的反馈,并不断优化更新。
微软小娜用户界面Torque中文版由微软(亚洲)互联网工程院的人工智能团队负责开发,并与位于美国雷德蒙总部和北京的微软研究院的研究员展开紧密合作。这支团队同时也负责微软人工智能助手Cortana中文版(微软小娜)本地化和开发,对于满足中国用户的本地化需求有着丰富的经验。目前中文版的迭代还在紧锣密鼓地进行着,每个星期Torque中文版都会推出一个新的版本。这支深根于本地的人工智能团队由曾担任微软雷德蒙研究院ISRC组的研发人员的杜奕瑾领导。杜奕瑾也曾担任美国国家卫生研究院人类基因研究所程式组长,是台湾批踢踢(台湾最大社交网络)和番薯藤(第一个中文搜索引擎公司)的联合创始人。对于这次如此一拍即合的合作,杜奕瑾说:“必应大数据平台和人工智能技术为微软的人工智能产品提供了强劲的大脑,我们将其与微软研究院20年的语音技术积累通过Torque最简单也最自然地集成在一起,希望能为人工智能在中国的发展开创一块新的版图。”在微软总部密切关注着Torque中文版开发的黄学东表示:“中国将会是未来全球人工智能产品最大的市场,开发Torque中文版体现了我们对中国用户的承诺,同时我们也希望在用户的帮助下,我们能够快速提升和进步。微软研究院与中国的人工智能产品团队合作十分融洽,双方的全力投入使得中文版本很快得到了实现。”
杜奕瑾(左)结语
Torque为下一代的移动交互方式提出了新的构想,它或者还不完美,还有待提升,但它的问世不仅折射出了语音技术的兴起之势,透过它,我们也看到了一个开放的、崇尚极客创新的“新”微软!
那么,你还在等什么,赶快下载试用吧!温馨提示,如果您摇晃手机后没有看到弹出窗口,请将Torque添加到您的手机安全和隐私设置“信任的应用程序”中再试用。
------------------------------------------------------------------------------------------
欢迎关注
微软亚洲研究院官方网站:http://www.msra.cn
微软亚洲研究院人人网主页:http://page.renren.com/600674137
微软亚洲研究院微博:http://t.sina.com.cn/msra
微软亚洲研究院微信:搜索“微软研究院”或扫描下方二维码:

Torque:轻应用背后的大蓄势 微软语音技术厚积薄发的更多相关文章
- 我大中华微软MVP中国区人才库
刘海峰:国内知名微软开源技术网站51Aspx 创始人,十年以上的Asp.net从业经验,微软MSDN特约讲师.Teched讲师.ImagineCup大赛评委.人大出版社研修班特约讲师,曾多次受邀访问美 ...
- 我大中华微软MVP中国区人才库(转)
出处:http://www.genshuixue.com/i-cxy/p/15349735 刘海峰:国内知名微软开源技术网站51Aspx 创始人,十年以上的asp.net从业经验,微软MSDN特约讲师 ...
- Winjs – 微软开源技术发布的 JavaScript 组件集
Winjs 是由微软开源技术的开发者推出的一组 JavaScript 组件,包括 ListView.ListView.Tooltip.DatePicker.Ratings 等等,帮助 Web 开发人员 ...
- 微软开放技术(中国)携 CKAN 和 OData 技术引入基于 Azure 的开放数据平台
今天,微软开放技术(中国)通过微软公有云Azure引入一个全新的开放数据平台,该平台基于开源数据门户解决方案 CKAN,以及由微软开放技术(中国)特别针对中国市场优化的ODATA插件来增强其国际化和本 ...
- 微软的技术态度 -- 从其对于CRT的设计考虑说起
很多人从C语言学习过来的人都知道,在编写程序时用到的像printf这样的函数,是作为该语言标准库函数提供的,这也是C语言标准中规定的内容.因此,操作系统必须对其保持一定程度上的透明,也就是说,作为一个 ...
- [深圳/广州]微软SQL技术沙龙分享会(MVP)
[深圳/广州] 新一期俱乐部活动报名开始,这次是广深地区SQL Server 技术沙龙分享会(MVP),SQL Server作为一个数据平台,不管是SQL Server 2017 on Linux 还 ...
- 微软的技术态度 -- 从其对于CRT的设计考虑说起(Thought on the CRT - What Microsoft Prefers)
很多人从C语言学习过来的人都知道,在编写程序时用到的像printf这样的函数,是作为该语言标准库函数提供的,这也是C语言标准中规定的内容.因此,操作系统必须对其保持一定程度上的透明,也就是说,作为一个 ...
- 微软Hyperlapse技术:让第一人称摄像稳定而流畅
编者按:GoPro等第一人称摄像设备已经几乎成为了极限运动者的标配,但拍摄过程中的抖动常会让画面非常糟糕.微软Hyperlapse技术实现了将第一人称录像转化成稳定而流畅的视频.该成果的论文已发表在S ...
- 社区活动分享PPT:使用微软开源技术开发微服务
上周六在成都中生代技术社区线下活动进行了一个名为"微软爱开源-使用微软开源技术开发微服务"的技术分享. 也算是给很多不熟悉微软开源技术的朋友普及一下微软最近几年在开源方面所做的努力 ...
随机推荐
- 一键分享mob,方法二
2.快速生成项目http://wiki.mob.com/android-sharesdk完整的集成文档/ 修改目标项目名称和项目的包名: 由于直接复制jar包和资源的集成方式比较麻烦,ShareSDK ...
- Dojo Grid结合Ajax用法
<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="CustomerDefine ...
- EL表达式和JSTL(三)——EL表达式
在JSP的开发中,为了获取Servlet中存储的数据,通常需要很多的Java代码,这样的做法使的JSP页面非常混乱,为此,JSP2.0中提供了一种EL规范,是一种简单的数据访问语言. 1.初识EL E ...
- 第04项目:淘淘商城(SpringMVC+Spring+Mybatis) 的学习实践总结【第二天】
淘淘商城(SpringMVC+Spring+Mybatis) 是传智播客在2015年9月份录制的,几年过去了.由于视频里课上老师敲的代码和项目笔记有些细节上存在出入,只有根据日志报错信息作出适当的调 ...
- PAT A1133 Splitting A Linked List (25) [链表]
题目 Given a singly linked list, you are supposed to rearrange its elements so that all the negative v ...
- Python中列表的copy方法
1.在列表中存在一个名为copy的方法,就像字面意思一样copy方法是用于复制列表元素的,示例如下: names = [‘Zhangsan’,’Lisi’,’WangErgou’] names2 = ...
- 个性化bash
zsh/on-my-zsh Ubuntu,deepin, 等可以使用 apt install 的系统 apt install zsh 一般就可以自动安装 RedHat(Fedora,Centos) ...
- Oracle存储过程案例集合
注:使用的工具为PLSQL Developer 壹.while简单使用(替换字符串中的字符,和REPLACE效果一样) 注: 这里没有使用REPLACE函数 1.建立存储过程 CREATE OR RE ...
- POJ 3585 Accumulation Degree【换根DP】
传送门:http://poj.org/problem?id=3585 题意:给定一张无根图,给定每条边的容量,随便取一点使得从这个点出发作为源点,发出的流量最大,并且输出这个最大的流量. 思路:最近开 ...
- 利用 wave 库 对音频进行格式处理
import wave r = r"D:\沫沫酱 - 旧伤口.wav" # 一个.wav格式文件 with wave.open(r, "rb") as f: # ...