HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学习服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学习的语音语言创新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】

1、抖音网红IP“虎墩小镖师”强势来袭

2、同声传译新亮相,底层技术大揭秘

3、AI翻译能力升级,语种扩充可播报

【专家观点】



Nicolas,华为2012实验室文本机器翻译高级专家

机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。



Hardy,HMS Core ML Kit 资深产品经理

AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。

【精彩答疑】

Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?

A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。

Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?

A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别的文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。

Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?

A:在金融电商领域,机器学习服务还提供了活体检测能力动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。

Q4:机器学习的宏观技术发展趋势是怎样的?

A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。

欢迎登录HMS Core机器学习服务首页了解更多技术细节。

了解更多详情>>

访问华为开发者联盟官网

获取开发指导文档

华为移动服务开源仓库地址:GitHubGitee

关注我们,第一时间了解 HMS Core 最新技术资讯~

HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态的更多相关文章

  1. HMS Core Discovery第13期回顾长文——构建手游中的真实世界

    HMS Core Discovery第13期直播<来吧!构建手游中的真实世界>,已于2月24日圆满结束,本期直播我们同三七游戏的专家一同向小伙伴们分享了HMS Core图形引擎服务(Sce ...

  2. HMS Core Discovery第14期回顾长文|纵享丝滑剪辑,释放视频创作力

    HMS Core Discovery第14期直播<纵享丝滑剪辑,释放视频创作力>,已于4月21日圆满结束,本期直播我们同HMS Core视频编辑服务(Video Editor Kit)的产 ...

  3. HMS Core Discovery第17期回顾|音随我动,秒变音色造型师

    HMS Core Discovery第17期直播<音随我动,秒变音色造型师>,已于8月25日圆满结束,本期直播我们邀请了HMS Core音频编辑服务的产品经理.技术专家以及创新娱乐类应用& ...

  4. HMS Core Discovery第14期直播预告~纵享丝滑剪辑,释放视频创作力

    [导读] 拍摄.导入.特效.卡点.BGM-几步简单的操作,我们便可将生活的瞬间用视频记录与分享.应用前沿AI技术,提供一站式视频处理能力,帮助开发者们构建更智能.更易用.更专业的视频剪辑软件,打造视频 ...

  5. HMS Core Discovery第17期直播预告|音随我动,秒变音色造型师

    [导读] 随着音视频内容品类的不断丰富及音乐创作门槛不断降低,大量用户正热切的参与到全民创作的大潮中.我们应该怎么去拥抱移动端影音潜力市场?音频编辑又可以有什么新玩法? 本期直播<音随我动,秒变 ...

  6. HMS Core Insights第八期直播预告--创新能力解读

    [导读] 在上个月举办的HDC2021华为开发者大会上,全新登场的HMS Core 6向大家展示了包括媒体.图形.连接与通信等领域的众多全新开放能力.如仅用一部RGB摄像头的手机即可完成的3D建模,在 ...

  7. HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅

    2022年6月,HMS Core机器学习服务面向开发者提供一项全新的开放能力--同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用. HMS Core同声传 ...

  8. HMS Core Discovery直播预告 | AI画质增强 ,开启超清视界

    [直播入口] B站华为开发者联盟:http://live.bilibili.com/22551651 4K.8K视频屡见不鲜,HD.FHD分辨率成小屏标配,当网络卡顿.视频自动切换到较低画质时,用户最 ...

  9. HMS Core AR Engine 2D图片/3D物体跟踪技术 助力打造更智能AR交互体验

    AR技术已经被广泛应用于营销.教育.游戏.展览等场景.通过2D图像跟踪技术和3D物体跟踪技术,用户只需使用一台手机进行拍摄,即可实现海报.卡牌等平面物体以及文物.手办等立体物体的AR效果.尽管近年来2 ...

随机推荐

  1. navicat软件、 python操作MySQL

    查询关键字之having过滤 having与where的功能是一模一样的 都是对数据进行筛选 where用在分组之前的筛选 havng用在分组之后的筛选 为了更好的区分 所以将where说成筛选 ha ...

  2. TS 自学笔记(一)

    TS 自学笔记(一) 本文写于 2020 年 5 月 6 日 日常废话两句 有几天没有更新了,最近学的比较乱,休息了两天感觉好一些了.这两天玩了几个设计软件,过几天也写篇文章分享分享. 为啥要学 TS ...

  3. Java泛型类型擦除问题

    以前就了解过Java泛型的实现是不完整的,最近在做一些代码重构的时候遇到一些Java泛型类型擦除的问题,简单的来说,Java泛型中所指定的类型在编译时会将其去除,因此List 和 List 在编译成字 ...

  4. [源码解析] TensorFlow 分布式之 ClusterCoordinator

    [源码解析] TensorFlow 分布式之 ClusterCoordinator 目录 [源码解析] TensorFlow 分布式之 ClusterCoordinator 1. 思路 1.1 使用 ...

  5. 数仓选型必列入考虑的OLAP列式数据库ClickHouse(中)

    实战 案例使用 背景 ELK作为老一代日志分析技术栈非常成熟,可以说是最为流行的大数据日志和搜索解决方案:主要设计组件及架构如下: 而新一代日志监控选型如ClickHouse.StarRocks特别是 ...

  6. Node.js连接MySQL数据库报错

    解决Node.js第一次连接MySQL数据库时出现[SELECT ERROR] - ER_NOT_SUPPORTED_AUTH_MODE: Client does not support authen ...

  7. 7. Docker CI、CD

    在上图这个新建的docker-compose.yml文件中把刚才的代码粘贴进去. 可把上述文件保存后,然后到/etc/ssh/sshd_config文件中更改下对应的端口号即可. 然后重新启动sshd ...

  8. MySQL并行复制(MTS)原理(完整版)

    目录 MySQL 5.6并行复制架构 MySQL 5.7并行复制原理 Master 组提交(group commit) 支持并行复制的GTID slave LOGICAL_CLOCK(由order c ...

  9. WIN32 API 获取文件版本信息

    CString strVersion; CString strPath(_T("xxxxxxxx.exe")); // 读文件信息 DWORD dwVerHnd = 0; DWOR ...

  10. 【Java面试】Mybatis中#{}和${}的区别是什么?

    一个工作2年的粉丝,被问到一个Mybatis里面的基础问题. 他跑过来调戏我,说Mic老师,你要是能把这个问题回答到一定高度,请我和一个月奶茶. 这个问题是: "Mybatis里面#{}和$ ...