高清语音也被称为宽带语音,是一种能为蜂窝网络、移动电话和无线耳机传输高清、自然语音质量的音频技术。与传统的窄带电话相比,高清语音很大程度上提高了语音质量,减少了听觉负担。

通信产业链上的所有网络和设备都需支持高清语音才能体现出该技术的优点。到2011年6月为止,18个国家运营的20种蜂窝网络,以及33家领先的手机品牌都已支持高清语音。通过部署自适应多速率宽带(AMR-WB)语音编码,GSM, WCDMA(UMTS)和LTE蜂窝网络中已经引入了高清语音。此外, 通过使用改良的子带编码(mSBC)语音编解码技术,无线蓝牙耳机也开始支持高清语音,将免提通话与高语音质量结合在了一起。

高清语音的优点同样可以在现有网络中体现出来。随着窄带网络和设备向高清语音过渡,一种名为带宽扩展(BWE)的语音处理技术可以用来在接收终端设备上模拟类似于高清语音的通话质量,为不支持高清语音的设备提供了一个折中的解决方案。

从窄带到高清语音

传统电话系统的带宽被限制在大约300Hz到3.4kHz的音频频率范围内(图表1),这一范围通常被称为窄带语音。尽管现在的电话系统是数字式的,但其还是传承了与传统模拟系统相同的带宽。从语音质量的角度来看,窄带语音缺乏自然语音保真度,常常被形容为单薄和模糊不清。尽管如此,窄带频率范围内完整语句的语音辨别度大概是99%。

高清语音在采样频率为16kHz时音频带宽大约为50Hz至7kHz,因此与窄带语音相比具有更清晰的语音信号。虽然宽带语音并没有显著提高语音清晰度,但是窄带范围之外的3.4kHz至7kHz提高了单词中的摩擦音(例如f、s和th) 的识别度。宽带语音能够提供更加自然真实的语音,在主观音频质量方面比窄带语音有了显著的提高。高清语音扩展出的50Hz至300Hz的低频降低了窄带语音尖细的特点,而扩展出的高频则提高了发音清晰度。

在主观语音质量听力测试中,宽带语音在平均意见得分(MOS)中得到4.5分,而窄带语音则为3.2分(1分为质量差,5分为优秀)。宽带语音质量的提高减少了听力负担和听者的疲劳,特别是当听者处于嘈杂的环境下。移动网络运营商Orange在其网站上提供了一个音频样本作为高清语音优点的例证。2010年6月Orange公司所做的另一项调查进一步向终端用户证明了高清语音的价值:

* 96%的客户对高清语音通话表示满意;

* 86%的测试者表示,兼容高清语音将是他们未来购买手机时的一个选择标准;

* 76%的测试者愿意更换手机以获得高清语音功能。

此外,2006年爱立信和T-Mobile进行的用户试用调查也证实了高清语音的优点。在150个抽样用户中,超过70%的人认为使用了高清语音手机后通话质量更好,在嘈杂的环境中对话质量有所提高。

使用高清语音需要语音通信系统中的所有环节都支持宽带语音频率范围。采用高清语音技术的关键是在蜂窝网络和手持电话中协同部署AMR-WB编解码。作为一种宽带语音编码,AMR-WB的有效音频带宽是窄带编码AMR-NB的两倍。要完成一个高清语音通话,基站和手持电话之间协同传输以AMR-WB编码的语音,在这一过程中没有进行语音修改或从终端到终端的转换编码。如果高清语音连接无法实现,系统就会取而代之使用窄带AMR-NB编码。

扩展语音带宽

可以预计,在引入高清语音的过程中,通信系统中的某些环节会因无法支持而将语音转换为窄带频率,这实际上是在降低语音质量,增加听力负担。人工带宽扩展(BWE)通过在通信系统的终端环节为窄带语音信号加入人工生成的语音内容,弥补在传输过程中损失的高频和低频语音内容。通过这种方法,BWE将高清语音的优势拓展到了窄带和过渡的混合带宽的语音通信系统中。

BWE算法使用产生语音的声源过滤模型来估算和产生扩展频率范围内的语音内容。根据该模型,语音是由一个声源(例如声带)再加上一个模拟声道的模型产生的。BWE算法根据窄带语音估算出一个宽带声源模型,然后利用该模型的参数估算出其丢失的宽带频率内容。在实际应用中,BWE独立于源编码和发送路径处理过程的,因此它可以与传统的窄带和混合带宽的电话网络共存。

BWE主要应用于蓝牙耳机和免提设备。在这些设备的接收终端上,窄带CVSD编码语音信号首先进行解码,然后经过BWE的处理产生给受话方的扩展带宽语音信号。BWE也可以应用在高清语音电话网络上,将语音信号扩展到带宽为14kHz的超宽带(SWB)频率范围。

高清语音和音效增强

将高清语音和音效增强处理方法(如噪声抑制(NS),回声消除(AEC) )结合在一起可以改善在噪声环境下的语音清晰度,并可以提高整体通话质量。噪声抑制技术能够分析掺杂了噪音的对话,并清除噪音,增加语音辨别度。 噪声抑制算法通过大量频点估算出噪声功率谱密度,然后将噪声从对话出抽取出来。与窄带的处理相比,宽带噪声抑制在计算噪声频谱时包含了更多的频点数据来压缩扩展频率范围内的噪声。除噪声抑制外,回声消除处理方法能消除发话者和麦克风之间的声音耦合所产生的回音信号。回声消除的工作原理是从麦克风接收到的信号中分离出一个经过过滤和延迟的副本。回声消除技术能够计算出宽带语音中的自适应过滤系数。

蓝牙耳机中的高清语音

由于当前蓝牙耳机已经成为免提移动通话的流行配置,因此它们能够兼容高清语音是十分重要的。这一功能已经通过蓝牙mSBC语音编解码器变为现实。

蓝牙高级音频分发模型(A2DP)规定使用子带编码(SBC)为强制音频编解码系统,以保证手持电话和耳机间的互操作性。SBC是一种低复杂度的编解码技术,压缩比率适中,支持16kHz, 32kHz, 44.1kHz和48kHz的采样率,也因此成为蓝牙高清语音的当然之选。对于16kHz的宽带语音而言,SBC能以64kbps数据速率对其进行4:1的压缩。但是,当SBC编码帧通过蓝牙传输时,它可能与底层蓝牙数据包不相匹配。因此,mSBC编解码技术被开发用于匹配SBC和蓝牙数据包,并于2011年5月被定义为Bluetooth Hands-Free Profile 1.6中的强制编解码方式。

在编解码性能方面,mSBC可与ITU-T G.722相媲美,这一宽带语音编解码系统通常被用来作为新编解码系统的质量评判参考。一般来说,mSBC在无差错语音信号方面的客观音频质量得分比G.722更高。mSBC编码系统也在多重编码/解码通道方面保持了比G.722更高的平均语音质量水平。

小结

与传统窄带语音传输相比,高清语音提供了十分优秀的语音质量,减少了在嘈杂环境中的听力负担。在听力测试和用户试用中,高清语音都表现出了显著优势。可以通过在蜂窝网络和手持电话中部署AMR-WB语音编解码系统、在蓝牙耳机中部署mSBC语音编解码系统来实现高清语音。此外,手持电话和耳机中采用噪声抑制和回音消除等语音处理算法能够使高清语音体验更佳。随着网络运营商和设备生产商逐渐将高清语音引入消费市场,蓝牙耳机上的带宽扩展处理方法能够将高清语音的优点带给窄带和混合带宽的蜂窝网络用户。

附录:

窄带与宽带音频的特征如下:

CVSD: pcm: 8kHz, 16 bits, 1 channel.

compression ratio: 16 (controller encoding)

insert ratio: 8

pcm data rate= 16kB/s =8K*16/8

CVSD data rate=8kB/s =16kB/s* 8/16

air data: CVSD

mSBC: pcm 16kHz, 16 bits, 1 channel.

compression ratio: 4 (host encoding: 240->60)

pcm data rate= 32kB/s

mSBC data rate=8kB/s = 32kB/s / 4

air data: transparent data (mSBC)

参考文档:

1 http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=21411227&id=5748646

高清语音技术(WBS)及其在手机和蓝牙耳机中的实现的更多相关文章

  1. JAVA版-微信高清语音.speex转.wav格式

    功能介绍: PC端将.speex文件解码为*.wav文件 使用场景: 在MAC/Linux下Java JNI 调用C Speex,后端Java处理微信服务器下载下来的微信高清语音.speex解码为.w ...

  2. 教你如何在linux操作系统下玩【俄罗斯方块】高清+语音教程

    主讲人小冰QQ:986945193 新浪微博:http://weibo.com/mcxiaobing 百度贴吧:忆驹家族小冰 腾讯微博:http://t.qq.com/q986945193 高清视频 ...

  3. 千金良方说:"我现在奉上179341字的MySQL资料包,还来得及吗?有"代码段、附录、和高清图!!"

    上一篇"上发布过"一不小心,我就上传了 279674 字的 MySQL 学习资料到 github 上了",我在更早之前,在微信公众号"老叶茶馆"上发布 ...

  4. 手机变为电脑的摄像头,使像素高清起来-使用DroidCam

    你是不是已经在嫌弃电脑自带的摄像头的渣渣像素呢? 今天给大家安利一个方法:将手机摄像头设置为电脑的摄像头,让像素高清起来,对于搞图像的同志们真是福音啊,尤其是做人脸识别的时候. 方法有很多种,我推荐我 ...

  5. SDWebImage -- 封装 (网络状态检测,是否打开手机网络下下载高清图设置)

    对SDWebImage 进行封装,为了更好的节省用户手机流量,并保证在移动网络下也展示高清图,对使用SDWebImage 下载图片之前进行逻辑处理,根据本地缓存中是否有缓存原始的图片,用户是否打开移动 ...

  6. Docker技术入门与实战第2版-高清文字版

      Docker技术入门与实战第2版-高清文字版 下载地址https://pan.baidu.com/s/1bAoRQQlvBa-PXy5lgIlxUg 扫码下面二维码关注公众号回复100011 获取 ...

  7. 图库网站Unsplash高清原图爬虫【华为云技术分享】

    [摘要] 写博客的好工具,快速获得高清图片 在百度图片爬虫小助手里,我开发了一个爬虫,来节约我写博客时搜集图片的时间. 但是,也出现了一些问题,主要有以下几点: 百度图片上的质量参差不齐,大部分图片质 ...

  8. 腾讯技术分享:GIF动图技术详解及手机QQ动态表情压缩技术实践

    本文来自腾讯前端开发工程师“ wendygogogo”的技术分享,作者自评:“在Web前端摸爬滚打的码农一枚,对技术充满热情的菜鸟,致力为手Q的建设添砖加瓦.” 1.GIF格式的历史 GIF ( Gr ...

  9. 标清与高清,720p和1080p,720i和720p,h264与h265

    480x320, 640x480 标清 1024x720p 高清 1920x1080i (隔行扫描) 也属于高清 1920x1080p 全高清 3840x2160,7680x4320 超(高)清   ...

随机推荐

  1. .net webapi 接收 xml 格式数据的三种情况

    webapi 接收 xml 的三种方法 前段时间接到一个任务写一个小接口,要接收java端返回过来的短信xml数据. 刚拿到项目,我的第一想法是对方会以什么形式发送xml格式的数据给我呢,设想三种情况 ...

  2. Nginx浅谈

    Nginx的产生 没有听过Nginx?那么一定听过它的"同行"Apache吧!Nginx同Apache一样都是一种WEB服务器.基于REST架构风格,以统一资源描述符(Unifor ...

  3. oracle 12c centos 7 安装配置

    1,安装centos 7 安装 宿主机配置信息: 内存:8G 系统盘:30G swap分区:30G (笑了oracle安装自检不过) /u01(50G) :oracle安装目录 /u02(50G): ...

  4. 从零开始学java(二)类与对象

    面向对象是把构成问题事务分解成各个对象,建立对象的目的不是为了完成一个步骤,而是为了描叙某个事物在整个解决问题的步骤中的行为. 类是对象的抽象,对象是类的具体实例. 1.构造一个类,让其拥有属性和方法 ...

  5. PL/SQL Developer 破解方法~

    1.有注册码的方式:亲自测试,立马见效 LicenseNumber : 999 productCode : 46jvnzf74ysf3mqm4hx4tvhcamh8gpe3v5 SeriesNumbe ...

  6. spring切换多数据源

    应用场景:在一个项目需要用到两个或两个以上的数据库时,要进行切换数据库,来操作相应的表. 框架:用的是spring 的org.springframework.jdbc.datasource.looku ...

  7. Eclipse neon 4.6 安装tomcat

    问题: Eclipse neon 4.6并没有内置Tomcat,所以当我产生想要导入.war,并部署到服务器时,会看到创建服务处是下面的情况: 也就是说,没有tomcat服务可以选择:为此我需配置To ...

  8. JavaBean动作元素

    用动作标签创建Javabeans实例 <jsp:useBean id="实例对象名" class="com.po.Users(类全名)" scope=&q ...

  9. lwip协议栈移植(1)

    lwip移植分为两类: 1,只移植内核核心,用户应用程序编写只能基于raw/callback api进行 2,移植内核核心和上层API函数模块,用户可以使用所有三种API编程,即 raw/callba ...

  10. git撤销commit 并保存之前的修改

    撤销并保留修改 参数 –soft  # 先进行commit ,之后后悔啦  $ git commit -am "对首篇报告研究员字段改为author_name" 执行git log ...