百度大脑UNIT3.0详解之嵌入式对话理解技术
相信很多人都体验过手机没有网时的焦虑,没有网什么也做不了。而机器人也会遇到这样的时刻,没有网或者网络环境不好的情况下,无法识别用户在说什么,也无法回复用户。在AIoT(AI+物联网)飞速普及的现在,智能对话已经渗透在许多行业场景中,融入在无数的智能设备里,比如智能家居、智能车载等。这些设备的智能化能力通常都依赖在线服务实现,但智能设备尤其是移动型智能设备可能存在无网情况。
在未来的AIoT领域中,大多场景都要求终端具备本地自主决断及响应能力,每个设备端都需要具备不依赖云端的独立计算能力,完成智能对话的本地识别,实现端计算,让设备无论在什么网络环境下都能够响应用户对话。针对这种场景的痛点,百度UNIT 3.0推出嵌入式对话理解技术,利用这项技术,可以实现本地化不联网的语义识别能力,结合语音的本地识别能力,结合云端的AI,让本地和云端的有效配合,以满足用户随时随地的对话需求。
【嵌入式对话理解技术解读】

嵌入式对话理解技术框架如上图所示,整体通过SDK提供给开发者,开发者可根据自己系统的情况,封装成系统应用,再整体集成入自己的设备中。其中SDK内部将提供离线中控的能力,来控制多个场景的分发与管理。在SDK中支持多个场景的集成,并提供通用的离线中控对它们进行分发、优先级排序等管理能力。
每一个单独场景的垂类技能主要包含了离线语义解析能力,包括基础分析、启发式语义理解技术、结果选择等技术模块,以及离线语义解析模型。
其中基础分析分析包含了query的特征、paddle模型结果、通用成分分析(分词、命名实体识别等)等技术。
启发式语义理解技术,包含了启发式的模板匹配识别、样本泛化匹配识别、结果融合推导等技术。
结果选择模块包含了非多轮结果的选择能力。
整体方案中,还提供了日志统计及分析能力,供开发者分析和提升效果使用。
【如何使用嵌入式对话理解技术】
目前,嵌入式对话理解技术已提供Android SDK,后续将逐步提供多种系统和平台,如QNX、Linux等。同时提供了开发者可自行修改和本地化训练的工具,包含完善的说明文档,开发者均可以在UNIT平台上下载试用。
进入UNIT平台“创新技术”区,点击“语义解析 离线使用”即可进入详情,按照操作步骤,可以下载对应的开发工具和安装包。

【四步获取资源,源码级控制】
第一步:确定业务是否适用离线解析
离线(断网)环境下的语义解析,对设备终端的性能是有一定要求。开发者需要确认自己的业务场景是否需要获得离线的语义能力,设备终端能否支持离线语义能力运行。
第二步:获取现有的离线场景文件,源码级修改
UNIT 3.0已有多个场景下的技能,可以直接在平台上下载对应的文件。部分场景下的解析文件,需要开发者向UNIT提交邮件申请获取,官方会沟通使用需求并提供支持。下载的技能文件,开发者如有更改技能的需求或者是提升识别的效果要求,均可以自行修改其中的模板等内容,平台上提供了数据优化配置的说明。

第三步:调用工具完成本地化训练
步骤二中的场景文件如有更改,开发者需要使用训练工具将该场景自行完成训练,训练后可以获得新的模型文件。训练工具和调用的方法、说明等均在UNIT平台上,支持开发者随时下载查阅和使用。
第四步:集成模型,使用SDK
步骤三生成的模型文件,按照SDK的要求放在对应的目录下,开发者可以在UNIT平台上直接下载SDK,按照调用说明直接使用即可。
【离在线融合对话能力的部署方案】
不同的业务场景会用到不同的解析和对话能力,在线服务具备更好的对话理解与满足,离线能力保证设备在各种环境下的核心智能交互稳定性;UNIT3.0提供了离在线融合的对话理解框架,开发者可以根据自身的业务情况,灵活选择离线与在线能力。

开发者可以检测自己的终端设备网络信号情况。当信号比较强时,可以统一走在线解析,在线的云端服务器拥有过更好的计算资源,理解效果会更好。当终端信号比较弱时,建议同时走在线和离线的部分,离线SDK会很快给出响应,在线SDK会根据不稳定的网络情况,可能存在一定的延时;此时开发者可以根据自己业务对性能的要求,来选择使用离线的结果,还是等待在线的结果。当终端无网络时,开发者只能选择离线SDK的方案,快速响应用户。
相关文章阅读:
百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力
百度大脑UNIT3.0详解之嵌入式对话理解技术的更多相关文章
- 百度大脑UNIT3.0详解之知识图谱与对话
如今,越来越多的企业想要在电商客服.法律顾问等领域做一套包含行业知识的智能对话系统,而行业或领域知识的积累.构建.抽取等工作对于企业来说是个不小的难题,百度大脑UNIT3.0推出「我的知识」版块专门为 ...
- 百度大脑UNIT3.0详解之数据生产工具DataKit
在智能对话项目搭建的过程中,高效筛选.处理对话日志并将其转化为新的训练数据,是对话系统效果持续提升的重要环节,也是当前开发者面临的难题之一.为此百度大脑UNIT推出学习反馈闭环机制,提供数据获取.辅助 ...
- 百度大脑UNIT3.0详解之语音语义一体化方案
在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默.打断机器人.噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈.而这些能力的获取与应 ...
- 百度大脑UNIT3.0智能对话技术全面解析
智能客服.智能家居.智能助手.智能车机.智能政务……赋予产品智能对话能力是提升产品智能化体验.高效服务的重要手段,已经开始被越来越多的企业关注并布局.然而,智能对话系统搭建涉及NLP.知识图谱.语音等 ...
- 百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力
在日常生活中,用户会经常碰到很多复杂的规章制度.规则条款.比如:乘坐飞机时,能不能带宠物上飞机,3岁小朋友是否需要买票等.在工作中,也会面对公司多样的规定制度和报销政策.比如:商业保险理赔需要什么材料 ...
- iOS百度地图简单使用详解
iOS百度地图简单使用详解 百度地图 iOS SDK是一套基于iOS 5.0及以上版本设备的应用程序接口,不仅提供展示地图的基本接口,还提供POI检索.路径规划.地图标注.离线地图.定位.周边雷达等丰 ...
- 发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线,这是百度All in AI一年后的最新答卷...
机器之心报道,作者:李泽南. 去年的 7 月 5 日,百度在北京国际会议中心开办了首届「AI 开发者大会」.在会上,百度首次喊出了「All in AI」的口号.一年的时间过去了,今天在同样地点举行的第 ...
- 减少HTTP请求之合并图片详解(大型网站优化技术)
原文:减少HTTP请求之合并图片详解(大型网站优化技术) 一.相关知识讲解 看过雅虎的前端优化35条建议,都知道优化前端是有多么重要.页面的加载速度直接影响到用户的体验.80%的终端用户响应时间都花在 ...
- Mysql加锁过程详解(8)-理解innodb的锁(record,gap,Next-Key lock)
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
随机推荐
- 高性能消息队列(MQ)Kafka 简单由来介绍(1)
Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据. 这种动作(网页浏 ...
- ASP.NET Core 中的 ObjectPool 对象重用(一)
前言 对象池是一种设计模式,一个对象池包含一组已经初始化过且可以使用的对象,而可以在有需求时创建和销毁对象.池的对象可以从池中取得对象,对其进行操作处理,并在不需要时归还给池子而非直接销毁他,他是一种 ...
- 科学使用Log4View2
目录 目录 前言 科学使用 编辑和调试程序集 调试程序集 编辑程序集 结语 推荐文献 目录 NLog日志框架使用探究-1 NLog日志框架使用探究-2 科学使用Log4View2 前言 这个标题很低调 ...
- Spring(Bean)5
spel <bean id="address" class="com.atguigu.spring.beans.spel.Address"> < ...
- 如何提高 PHP 代码的质量?第二部分 单元测试
在“如何提高 PHP 代码的质量?”的前一部分中:我们设置了一些自动化工具来自动检查我们的代码.这很有帮助,但关于我们的代码如何满足业务需求并没有给我们留下任何印象.我们现在需要创建特定代码域的测试. ...
- 混淆矩阵-MATLAB代码详解
一.混淆矩阵 (一).简介 在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵.在图像精度评价中,主要用于比较分类结果和实际测得值, ...
- Python自带又好用的代码调试工具Pdb学习笔记
返璞归真 这几天项目有一个linux下部署数据库的操作,数据库使用python进行初始化安装.然后问题来了,由于linux服务器涉及安全要求,除了代码以来的Python3.6版本外不允许安装其他插件与 ...
- shell 读取文件第几列
读取文件的第2列和第4列: cat filename.txt | awk '{ print $2 $4 }' 求文件file1.txt的第二列 和 file2.txt(单列文件)的交集: cat fi ...
- 【已解决】解决IntelliJ IDEA控制台输出中文乱码问题
IntelliJ IDEA 真的是一款很方便的Java开发工具,但是关于中文乱码这个问题我不得不吐槽,这个编码也弄得这么麻烦干嘛,真想找idea开发者干架,我敢打包票我能在一分钟之内一拳飞过去让他跪下 ...
- 配置React Native的开发环境
本文转载自:http://mp.weixin.qq.com/s?__biz=MzIxNjEzNjUzOQ==&mid=402020148&idx=2&sn=ccad14a919 ...