用Kinect为听障人士架一座沟通的桥梁
编者按:这是微软亚洲研究院和中国科学院共同进行的一个合作项目,希望通过使用Kinect来帮助提升手语的识别率,从而为听力受损的残障人士(以下简称听障人士)架起一座与外界沟通的桥梁。
文章译自:Digital
Assistance for Sign-Language Users
对于听障人士来说,手语是他们与外界沟通最主要的语言。然而,不是每个人都懂得手语,即使是人工手语翻译也是可遇不可求。通过计算机来识别手语,然后进行翻译,听上去是一个很好的想法,但这个想法到今天为止却还未真正得以实现。正因如此,近些年来研究人员花费了大量时间攻克手语识别领域所存在挑战。他们曾研究过诸如数据手套或特殊摄像头这样的输入传感器潜在的发展空间。虽然前者在识别方面表现很好,但因为难以穿戴和过于昂贵很难投入广泛使用。而网络摄像头或立体摄像头虽然能够保证追踪手部运动的精度和速度,却很难处理好复杂背景和光照。
然后,一种叫做Kinect的设备进入人们视野。微软亚洲研究院的研究员与中国科学院计算技术研究所的同僚展开合作,对Kinect的肢体追踪功能如何应用于手语识别进行了研究。结果让人欣慰!这项技术让以手语为主要沟通手段的听障人士像使用语音识别一样,与电脑进行更为自然和流畅的互动。
“在我们看来,这个项目最显著的贡献是它向我们展示了通过3-D和2-D传感器构建手语识别的可能。”中国科学院陈熙霖教授表示。
在微软研究院学术合作部的帮助和支持下,这项成果被总结成为论文《基于Kinect的手语识别和翻译》,联合作者为中国科学院柴秀娟、李广、陈熙霖等研究员,以及微软亚洲研究院首席研究员周明。
正因为Kinect能够同时提供深度信息和色彩数据,它让准确、快速追踪手部和肢体动作变得更加容易。
近日,微软研究院第14届教育高峰会(Faculty
Summit 2013)在微软总部举行,其中的展示环节Demo
Fest 与超过400名学术研究者们分享了具有深远影响力的研究,其中就包括该手语识别项目。这是一个3-D运动轨迹校准并将手语和单词逐一对应的过程。当一个手语词汇被分析时,这些词语先通过Kinect
for Windows SDK的手部动作轨迹生成,然后规范化,继而计算匹配分数,最后识别出最相关的候选。
反过来,3-D轨迹匹配的算法又为构建一个手语识别和翻译的系统创建了基础。这一系统包括两个模式。第一是翻译模式,将手语翻译成文本或者语音,包括对单词或单句的识别。第二是交流模式,通过使用虚拟形象使正常人和听障人士的沟通变成可能。以键盘输入的文本为引导,虚拟形象可以表现出相应的手语。而听障人士通过手语进行回应,系统会将其转换为文本进行回答。
Kinect手语识别项目真实场景演示片段
这样有效吗?出乎意料地有效!
“这个项目一个独特的贡献是联合了计算机研究员和听障人士的共同努力,”周明说,“一群来自特殊学院的教师和学生加入了这个项目,使得我们的算法数据来源于真实的世界”。
这刚好与项目的目标相契合。该研究在视觉信息处理领域颇具价值,与此同时,也为那些极需此类援助的人群提供了帮助。
“自从Kinect问世以来,我们已经不止一次惊喜地看到它被研究人员进行‘再创造’”,微软研究院学术合作部,负责自然用户界面相关学术研究合作的主管Stewart
Tansley表示,“该项目是学术界与微软研究院紧密合作的一个范例,也证明了科技的潜力——跨越语言和文化的界限,潜移默化地改善我们的生活,最终让我们彼此之间联系得更为紧密。”
这项研究在视觉信息处理领域具有巨大的价值,同时它也旨在为那些主要依赖手语进行交流的人们提供实际援助。
“我们相信IT应该被用来提升所有人的日常生活质量,”微软亚洲研究院研究项目经理吴国斌说,“希望这项成果在不久的将来能够为听障人士提供一个日常互动工具,在他们和拥有正常听力的人之间架起一座桥梁。”
相关阅读:
欢迎关注
微软亚洲研究院官方微博:http://e.weibo.com/msra/profile
微软亚洲研究院人人主页:http://www.renren.com/600674137
用Kinect为听障人士架一座沟通的桥梁的更多相关文章
- 探索Kinect的更多可能——亲历第十九届机器人世界杯RoboCup
作者:微软亚洲研究院资深项目经理 吴国斌 2015年7月19日,第十九届RoboCup机器人世界杯足球赛,在中国合肥隆重开幕.来自全球七十六个国家和地区的一百余支代表队参加了决赛,他们优秀的作品给观众 ...
- “冰桶挑战”之外:微软科技助力ALS患者
编者按:"直到ALS出现治疗方法,科技就是我的解药."ALS患者,前美国橄榄球联盟(NFL)球员Steve Gleason如是说.最近,一支微软首届黑客马拉松(Hackathon) ...
- 雅虎UED--无障碍网页设计
转自:http://www.sharetk.com/html/ued/Interactive-Design/1394.html 随着web使用量的增加和人们网络意识的增强,一些特殊用户开始被我们所关注 ...
- HTML入门3
HTML主要工作在于编辑文本结构和文本内容,也称语义(semantics)以便能够再浏览器正确地显示,下面开始介绍在文本中添加标题,段落,强调语句,创建列表等等 基础:标题和段落 内容结构化会使得阅读 ...
- Python猫荐书系列之七:Python入门书籍有哪些?
本文原创并首发于公众号[Python猫],未经授权,请勿转载. 原文地址:https://mp.weixin.qq.com/s/ArN-6mLPzPT8Zoq0Na_tsg 最近,猫哥的 Python ...
- Insights直播回顾——手语服务,助力沟通无障碍
HMS Core Insights第九期直播–手语服务,助力沟通无障碍,已于12月29日圆满结束,本期直播与小伙伴们一同了解了HMS Core手语服务的亮点特性.底层技术以及演进规划,下面我们一起来回 ...
- HMS Core新闻行业解决方案:让技术加上人文的温度
开发者们,你希望用户如何获取新闻? 有的人靠手机弹窗知天下事,有的人则在新闻应用中尽览每一篇文章:有的人一目十行,有的人则喜欢细细咀嚼:有的人主动探索,有的人则想要应用投其所好. 科技在不断刷新着用户 ...
- 华为HMS Core携手超图为三维GIS注入新动能
6月30日,在2022(第五届)GIS软件技术大会GIS基础软件新技术板块论坛上,华为联合超图推出了基于HMS Core 3D Engine开发的高保真三维GIS插件,通过3D渲染技术助力三维GIS实 ...
- 【毕业设计】基于Android的家校互动平台开发(内含完整代码和所有文档)——爱吖校推(你关注的,我们才推)
☆ 写在前面 之前答应大家的毕业答辩之后把所有文档贡献出来,现在答辩已过,LZ信守承诺,把所有文档开源到了GitHub(这个地址包含所有的代码和文档以及PPT,外层为简单的代码).还望喜欢的朋友们,不 ...
随机推荐
- win10编译jpeglib
jpeglib看名字都大概知道和图像格式jpg或jpeg有关了,是一个常用的图像处理软件都会依赖的开源库. 首先去官网下载jpeglib的源码,直接取这里下载:http://www.ijg.org/f ...
- 使用那各VUE的打印功能(print.js)出现多打印一个空白页的问题
最近这段时间,用VUE写东西,有个打印功能. 百度了一下,铺天盖地的VUE打印的两种实现方法. 很感激这些千篇一律的帖子,虽然不知道他们是否真的用过,还是只是复制粘贴. 至少这些帖子告诉我,是有两个可 ...
- pytorch 自动求梯度
自动求梯度 在深度学习中,我们经常需要对函数求梯度(gradient).PyTorch提供的autograd包能够根据输入和前向传播过程自动构建计算图,并执行反向传播.本节将介绍如何使用autogra ...
- UML-UML工具与UML蓝图
1.UML应用场景 1).UML作为草图 2).UML作为蓝图. UML生成java代码(前向工程) java代码生成UML(逆向工程) 2.如果绘制了UML草图,如何在编码后更新该图形? 逆向工程, ...
- 2020 年最流行的 Java 开发技术
不知不觉间,2020 年即将于十几天之后到来,作为技术圈中你,准备好迎接最新的变化了吗?在本文中,我们将以编程界最常用的编程语言 Java 为例,分享最为主流的技术与工具. 作者 | divyesh. ...
- Linux CMD 笔记 & 正则表达式
一.linux bash 1. 进程名查找kill ps -ef | grep xxxx| grep -v grep| cut -c 9-15 | xargs kill -9 2.端口号kill 占用 ...
- 洛谷 P1731 [NOI1999]生日蛋糕 && POJ 1190 生日蛋糕
题目传送门(洛谷) OR 题目传送门(POJ) 解题思路: 一道搜索题,暴力思路比较容易想出来,但是这道题不剪枝肯定会TLE.所以这道题难点在于如何剪枝. 1.如果当前状态答案已经比我们以前某个状态 ...
- centos6.5源码升级内核
centos6.5源码升级内核 升级前 系统版本: CentOS5.5 内核版本: 2.6.18-194.el5 升级前做过简单配置文件修改 yum -y upgrade 升级后 系统版本: ...
- Python说文解字_杂谈07
1. 深入dict from collections.abc import Mapping,MutableMapping # dict 属于mapping类型 a = {} print(isinsta ...
- Python笔记_第四篇_高阶编程_进程、线程、协程_4.协程
1.协程的概念: 子程序或者子函数,在所有语言中都是层级调用,比如A调用B,再B执行的过程中又可以调用C,C执行完毕返回,B执行返回,最后是A执行完毕返回.是通过栈来实现的,一个线程就是执行一个自称, ...