1.3  AI语音简介

AI语音既人工智能语音技术,以语音识别技术为开端,实现人机语言的通信,包括语音识别技术(ASR)、自然语言处理技术(NLP)和语音合成技术(TTS)。通俗点说就是通过语音这个媒介进行人与机器交互的技术就是人工智能语音技术。

从上文不难看出,AI语音其实就是将人与人之间的语音交互,切换到人与机器的交互,发送人仍然是人,但接受人转换为机器了。

1.3.1  AI语音技术简介

AI语音技术主要包含语音识别技术(ASR)、自然语言处理技术(NLP)和语音合成技术(TTS)等3大技术。

(1)语音识别技术(Automatic Speech Recognition,ASR),自动将语音转化成文字的技术。

(2)自然语言处理技术(Natural Language Processing,NLP),理解语音识别的文字并给出理解反馈的技术。

(3)语音合成技术(Text to Speech,TTS),针对自然语言处理后的需要机器语音反馈内容,进行文本转化成语音的技术(语音合成技术其实就是语音识别技术的逆过程)。

对标人与人之间的语音交互,我们把发送人想成发送语音命令的用户,接收人想成智能机器。这样语音识别技术(ASR)就相当于语音交互的“接收”阶段,感知对方说话内容。自然语言处理技术(NLP)就相当于语音交互的“解码”阶段,理解对方话语的含义。语音合成技术(TTS)则相当于“发送”阶段,把智能机器想说的话通过扬声器播放出来,反馈给用户。

1.3.2  AI语音交互简介

当前AI语音技术的应用落地都采用人工智能语音交互方式,AI语音交互是基于语音识别(Automatic Speech Recognition,ASR)、自然语言处理(Natural Language Processing,NLP)和语音合成(Text-To-Speech,TTS)等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有实际应用案例。不仅仅是电脑、手机,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视、智能导航,智能家居等,智能技术将在人们生活的各个方面提供更加方便快捷的服务。

如图1-4所示的siri(苹果智能语音助手)、天猫精灵、百度地图智能助手都是目前成熟的AI语音产品,大家可能在生活中也早就有接触。





图1-4  AI语音产品:siri(苹果智能语音助手)、天猫精灵、百度地图智能助手

【第5篇】AI语音简介的更多相关文章

  1. MMORPG战斗系统随笔(三)、AI系统简介

    在设计一款游戏的时候,如果我们是玩家,是希望自己能够操作角色畅玩游戏的.在一款MMORPG游戏中,大部分的实际游戏角色,是需要玩家来操作的,通过在游戏大世界相互完成游戏中的任务等等来体验游戏.在大世界 ...

  2. iOS开发UI篇—核心动画简介

    转自:http://www.cnblogs.com/wendingding/p/3801036.html iOS开发UI篇—核心动画简介 一.简单介绍 Core Animation,中文翻译为核心动画 ...

  3. 美景听听Ai语音导游,助力华为荣耀PLAY手机发布

    6月6日,荣耀PLAY科技酷玩新品发布会在北京大学生体育馆如期举办,美景听听Ai语音讲解助力新EUMI系统智慧旅行成新卖点,震撼登场! 随着生活水平的不断提升,出门旅行已经成了许多亲们释放压力.调节自 ...

  4. AI语音验证码识别

    欢迎使用AI语音验证码识别v4.0程序程序调用方法:http://code.hbadmin.com/?url=http://code.hbadmin.com/demo/2118534.wav [试听] ...

  5. AI 语音对话技术

    机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息.与机器进行交互,将不再只是存在科幻情结当中.语音交互是未来的方向,而智能音箱则是语音交互落地的第一 ...

  6. .NETCoreCSharp 中级篇2-3 Linq简介

    .NETCoreCSharp 中级篇2-3 本节内容为Linq及其拓展方法.Linq中表达式树的使用 简介 语言集成查询(LINQ)是一系列直接将查询功能集成到C#语言的技术统称.数据查询历来都表示为 ...

  7. AI - AutoKeras - 简介

    前言 在数据集上训练神经网络时,主要有两个目标: 定义符合数据集特性的神经网络架构. 在许多试验中对一组超参数进行调优,从而使得模型具有较高的准确率并且能够泛化至训练集和测试集之外的数据. 针对不同的 ...

  8. CloudNotes之领域建模篇:领域模型简介

    CloudNotes领域模型还是相对简单的,并不一定需要采用面向领域驱动的设计方法来解决CloudNotes的领域问题.但出于以下几个方面的原因,我还是采用了面向领域驱动的方式来开发CloudNote ...

  9. Python学习【第一篇】Python简介

    Python简介 Python前世今生 Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言. 现在,全世界差不多有600多种编 ...

随机推荐

  1. 【java】学习路线3-二维数组声明与初始化、Arrays类

    import java.util.Arrays;public class Learn02{    public static void main(String[] args){        Syst ...

  2. 一 策略模式 来自CBF4LIFE 的设计模式

    刘备要到江东娶老婆了,走之前诸葛亮给赵云(伴郎)三个锦囊妙计,说是按天机拆开解决棘手问题,嘿,还别说,真是解决了大问题,搞到后是周瑜陪了夫人又折兵呀,那咱们先看看这个场景是什么样子的. 先说这个场景中 ...

  3. 第四十八篇:webpack的基本使用(二) --安装和配置webpack-dev-server插件

    好家伙, 1.webpack中的默认约定 默认的打包入口文件为src  -->index.js 默认的输出文件路径为dist -->main.js 既然有默认,那么就说明肯定能改 2.en ...

  4. 累加和为 K 的最长子数组问题

    累加和为 K 的最长子数组问题 作者:Grey 原文地址: 博客园:累加和为 K 的最长子数组问题 CSDN:累加和为 K 的最长子数组问题 题目描述 给定一个整数组成的无序数组 arr,值可能正.可 ...

  5. Python数据科学手册-机器学习之特征工程

    特征工程常见示例: 分类数据.文本.图像. 还有提高模型复杂度的 衍生特征 和 处理 缺失数据的填充 方法.这个过程被叫做向量化.把任意格式的数据 转换成具有良好特性的向量形式. 分类特征 比如房屋数 ...

  6. 基于 Apache Hudi + Presto + AWS S3 构建开放Lakehouse

    认识Lakehouse 数据仓库被认为是对结构化数据执行分析的标准,但它不能处理非结构化数据. 包括诸如文本.图像.音频.视频和其他格式的信息. 此外机器学习和人工智能在业务的各个方面变得越来越普遍, ...

  7. es,logstash各版本对应要求的JDK版本,操作系统对应示意图

    官网地址:https://www.elastic.co/cn/support/matrix

  8. 数据卷Volume

    数据卷概述 Kubernetes Volume(数据卷)主要解决了如下两方面问题: 数据持久性:通常情况下,容器运行起来之后,写入到其文件系统的文件暂时性的.当容器崩溃后,kubelet 将会重启该容 ...

  9. PPR的断管

    1. 小管径PPR管的断管 2. 大管径PPR管的断管

  10. MySQL数据库-数据表(下)

    分析:给 reader 表添加数据. INSERT INTO:插入数据,插入数据的时候会检查主键或者唯一索引,如果出现重复就会报错: 语法:INSERT INTO table_name VALUES ...