HDC2022的无障碍参会体验,手语服务是如何做到的?
华为开发者大会2022(HDC)上,HMS Core手语数字人以全新形象亮相,并在直播中完成了长达3个多小时的实时手语翻译,向线上线下超过一千万的观众提供了专业、实时、准确的手语翻译服务,为听障人士提供了无障碍参会体验。面对专业性强且词汇量大的科技大会,HMS Core手语数字人是如何准确且流畅地打出手语的?
【解决三大技术难题,科技词汇信“手”拈来】
直播中的实时手语翻译较传统翻译和文本转手语的翻译更为复杂,主要在于语音识别过程中各类场景声学环境复杂难部署;手语词汇数据量少,尤其是专业领域词汇较为匮乏;同时,手语语言具有独特的语序逻辑,并非按照日常说话顺序逐字翻译,而要对语句进行语序调整,比如“我有许多朋友,其中既有健听人,也有聋人”的手语语序是“我/朋友/多,听人/有,聋1/有”。由于手语视觉语言的独特性,手语表达中表情、动作位置、动作方向、体态变化、动作幅度大小等都是影响手语可懂度的重要因素。
“我有许多朋友,其中既有健听人,也有聋人。”的手语语序是
“我/朋友/多,听人/有,聋1/有。”
为了让手语数字人实现高可懂度的AI手语能力,HMS Core手语服务技术团队整合了“语音、手语”全链路的AI能力,解决了三大技术点:语音识别的准确度、手语翻译的准确度、手语动作的流畅度与节奏感。
首先,为了确保直播中演讲者语音能被精准识别,尤其是大量中英文混合的技术名词,HMS Core手语数字人语音识别功能,采用动态的流式声学建模技术,实现了1秒以内即可出识别结果,同时借助热词等定制手段,专业术语的识别效果也得到了定向优化,这为手语数字人下一步的手语翻译提供了高精准度的文本基础。
在手语翻译准确度方面,HMS Core手语服务专门组织了一个动作优化团队,并在机器翻译、手语转写等算法方面进行了创新:通过机器翻译算法,中文表达可快速转写为手语表达,并自动进行词序调整、词义消歧、表情分析;通过双重迁移学习等方法,让算法理解句子的语义和语境,并准确估计出每个手语词对应的体态、表情及口型,实现手语动作、体态、表情、口型全方位地生动表达,有效提升手语转写的准确率及速度。
此外,手语生成方案融合了大量手语语言学研究成果,通过调整词、词组、句子之间的停顿及速度等,增强节奏感。同时,参考新闻手语主播的手语打法,预训练模型的语句浓缩算法,可将复杂的长句浓缩为简单的短句,并基于语义进行翻译,最终生成流畅且符合听障人士表达习惯的手语动作。
对于在HDC大会上常用的科技词汇“华为”,“鸿蒙”及“人工智能”等,其标准打法已纳入HMS Core手语词汇库。而对于大会上“原子化服务”等较少见的组合型专业词汇,则按字面意思将其拆解成“原子”“化”“服务”三个手语动作,同时生成对应的口型。
“原子化服务”
【产品竞争力跃升,从技术创新到产业应用】
HMS Core手语服务经过一年多的发展和技术迭代,目前已支持2万+中文手语词汇,匹配日常沟通交流、新闻、教育、政务办理等丰富场景。当前手语数字人不仅能流畅地打出手部动作,还有丰富的表情和准确的口动,从微笑、开心到惊讶、疑惑、失望等,多达26种表情,灵动又逼真,做到了“听得准”、“翻得对”、“打得好”,更好地为保障听障者的社会参与提供了助力。
目前,HMS Core手语服务已携手音书、知音、畅听无碍、开普云、棉花糖科技、未来媒体、硅基智能等众多开发者,成功将AI手语翻译能力应用在各行各业,完善了无障碍环境建设。畅听无碍app,通过集成HMS Core手语服务,在应用内实现了AI手语翻译功能,让听障人士随需随用,满足他们在日常生活中沟通交流、学习娱乐的需求,同时还能帮助他们在政府、医疗、金融、法律等专业公共服务领域实现无障碍交流。
HMS Core手语服务的应用将不断助力开发者搭建更好的无障碍传播环境,帮助听障者更好地享受信息化发展成果,为他们带来更多陪伴、更多实时交互以及更深的情感联结。未来,HMS Core手语服务,将持续践行“科技,不让任何一个人掉队”,与广大开发者伙伴一起,助力构建数字生态,让无障碍体验惠及更多人。如需进一步了解,请访问HMS Core手语服务。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
HDC2022的无障碍参会体验,手语服务是如何做到的?的更多相关文章
- Insights直播回顾——手语服务,助力沟通无障碍
HMS Core Insights第九期直播–手语服务,助力沟通无障碍,已于12月29日圆满结束,本期直播与小伙伴们一同了解了HMS Core手语服务的亮点特性.底层技术以及演进规划,下面我们一起来回 ...
- PB级大规模Elasticsearch集群运维与调优实践【>>戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...
- Elasticsearch索引容量管理实践【>>戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...
- 腾讯健康码16亿亮码背后的Elasticsearch系统调优实践【>>戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>>Elasticsearch Service新用户特惠狂欢低至4折>>Elasticsearch Service企 ...
- Dapr初体验之服务调用
初次理解服务调用 在微服务中,有一个难点就是:如果你想使用各个服务组件,你就得知道不同服务的地址和端口,也就是服务发现. 在传统应用我们是怎么做的?就是在web项目里配置上api地址,如下: 在一个w ...
- Re:从0开始的微服务架构--(二)快速快速体验微服务架构?--转
原文地址:https://mp.weixin.qq.com/s/QO1QDQWnjHZp8EvGDrxZvw 这是专题的第二篇文章,看看如何搭建一个简单模式的微服务架构. 记得好久之前看到一个大牛说过 ...
- 华为开发者大会HDC2022:HMS Core 持续创新,与开发者共创美好数智生活
11月4日,华为开发者大会HDC2022在东莞松山湖拉开帷幕.HMS Core在本次大会上带来了包括音频编辑服务的高拟真歌声合成技术.视频编辑服务的智能提取精彩瞬间功能.3D Engine超大规模数字 ...
- HMS Core使能AI智慧体验,共建创新应用生态
5月17日,2022年搜狐科技峰会成功举办,峰会汇聚各界大咖,共同探讨AI 技术的深入应用以及行业数字化的发展趋势.华为终端云服务应用生态BU总裁望岳发表题为<使能AI智慧体验,共建创新应用生态 ...
- node服务成长之路
我们的系统也从第一代平台开始到现在第四代平台更换中,对这四代平台做一个简单的介绍: 第一代平台,主要是集中式,以快速上线为目的:第二代平台主要是分布式改造,缓解各服务压力:第三代平台主要做服务端SOA ...
- 依赖注入[6]: .NET Core DI框架[编程体验]
毫不夸张地说,整个ASP.NET Core框架是建立在一个依赖注入框架之上的,它在应用启动时构建请求处理管道过程中,以及利用该管道处理每个请求过程中使用到的服务对象均来源于DI容器.该DI容器不仅为A ...
随机推荐
- IDEA 修改注释的颜色
- Python数据科学手册-Pandas:累计与分组
简单累计功能 Series sum() 返回一个 统计值 DataFrame sum.默认对每列进行统计 设置axis参数,对每一行 进行统计 describe()可以计算每一列的若干常用统计值. 获 ...
- Html飞机大战(十七): 优化移动端
好家伙,继续优化, 好家伙,我把我的飞机大战发给我的小伙伴们玩 期待着略微的赞赏之词,然后他们用手机打开我的给他们的网址 然后点一下飞机就炸了. 游戏体验零分 (鼠标点击在移动端依旧可以生效) 好 ...
- 14. Fluentd输出插件:out_forward用法详解
out_forward是一个带缓存的输出插件,用于向其他节点转发日志事件,并支持转发节点之间的负载均衡和自动故障切换. out_forward支持至多一次和至少一次传输模式,默认为至多一次. out_ ...
- 【可视化大屏教程】用Python开发智慧城市数据分析大屏!
目录 一.开发背景 二.讲解代码 2.1 大标题+背景图 2.2 各区县交通事故统计图-系列柱形图 2.3 图书馆建设率-水球图 2.4 当年城市空气质量aqi指数-面积图 2.5 近7年人均生产总值 ...
- PAT (Advanced Level) Practice 1002 A+B for Polynomials 分数 25
This time, you are supposed to find A+B where A and B are two polynomials. Input Specification: Each ...
- PAT (Basic Level) Practice 1028 人口普查 分数 20
某城镇进行人口普查,得到了全体居民的生日.现请你写个程序,找出镇上最年长和最年轻的人. 这里确保每个输入的日期都是合法的,但不一定是合理的--假设已知镇上没有超过 200 岁的老人,而今天是 2014 ...
- TWS耳机蓝牙建连过程_HCI版本
TWS耳机信息:Enco Air2 手机信息:onePlus8 ColorOS V12.1 其他准备工作:手机进入开发者模式,打开本地日志开关.可参考上一篇文章 https://www.cnblog ...
- 编程架构演化史:远古时代,从打孔卡(Punched Card)开始
回想读书时记录到书本里的打孔纸带编程,到初学编程接触到的C语言高级编程,再到C++.Java面向对象语言产生:从面向过程系统设计 到面向对象系统设计:从三层结构到MVC.MVP.MVVM:从主机到虚拟 ...
- linux开放端口并测试
开放端口操作 开放端口 先开启防火墙(才能用开启端口的命令) systemctl start firewalld.service 开放端口 firewall-cmd --zone=public --a ...