OGG的孩子-有损音频编码opus

　　Opus是一个有损声音编码的格式，由Xiph.Org基金会开发，之后由互联网工程任务组（IETF）进行标准化，目标用希望用单一格式包含声音和语音，

取代Speex和Vorbis，且适用于网络上低延迟的即时声音传输，标准格式定义于RFC 6716文件。Opus格式是一个开放格式，使用上没有任何专利或限制。

Opus集成了两种声音编码的技术：以语音编码为导向的SILK和低延迟的CELT。Opus可以无缝调节高低比特率。在编码器内部它在较低比特率时使用线

性预测编码在高比特率时候使用变换编码（在高低比特率交界处也使用两者结合的编码方式）。Opus具有非常低的算法延迟（默认为22.5 ms），非常适

合用于低延迟语音通话的编码，像是网络上的即时声音流、即时同步声音旁白等等，此外Opus也可以通过降低编码比特率，达成更低的算法延迟，最低可

以到5 ms。在多个听觉盲测中，Opus都比MP3、AAC、HE-AAC等常见格式，有更低的延迟和更好的声音压缩率。

　　从技术上来讲，它的指标是非常高的，具体的技术特性如下所示：性能比较如下图所示：

6 kb/秒到510 kb/秒的比特率；单一频道最高256 kb/秒
采样率从8 kHz（窄带）到48 kHz（全频）
帧大小从2.5毫秒到60毫秒
支持恒定比特率（CBR）、受约束比特率（CVBR）和可变比特率（VBR）
支持语音（SILK层）和音乐（CELT层）的单独或混合模式
支持单声道和立体声；支持多达255个音轨（多数据流的帧）
可动态调节比特率，音频带宽和帧大小
良好的鲁棒性丢失率和数据包丢失隐藏（PLC）
浮点和定点实现

　　提起opus，不能不提对opus发展贡献很大的两家伟大公司google和skype 以及一个开源组织Xiph。它的开发者是Xiph和skype，其中，它支持音乐（CELT层）

的这部分是由Xiph在继承speex的基础上开发的，这里面的主要贡献者是Jean-Marc Valin（这位老兄十分专注于研究音频编解码，音频编码领域两个开源项目speex

和opus的核心开发者，作为一个程序员，能有这般的贡献，绝对是属于程序员中的第一梯队了）。它支持语音（SILK层）的部分是由skype公司贡献的，skype在是

网络语音服务的执牛耳者，以它的开发实力和在网络音频领域业界的广泛应用，使得silk在语音压缩传输这块绝对可以独步武林。在近十年来，凡是能够领先世界的

互联网技术，总少不了gooole的身影，google在opus的普及中做了大量的贡献，一则就是把opus的性能做了一个严谨的数据分析，给出了opus为什么那么优秀的数

据支撑。另外一个就是在它的产品中广推opus，这个广告效应不是花钱能够搞定的。

　　随着opus在最近几年的迭代速度逐渐加快，代码的已经非常成熟了，文档和测试代码也都非常的详尽，很容易上手。后面我会对opus的代码做一个分析。包括移植

使用等。

参考文档：

1 https://zh.wikipedia.org/wiki/Xiph.Org%E5%9F%BA%E9%87%91%E6%9C%83

2 https://jmvalin.ca/

3 https://opus-codec.org/comparison/

4 https://opus-codec.org/

OGG的孩子-有损音频编码opus的更多相关文章

ogg的孩子-无损音频编解码flac
flac是一款无损的音频压缩编码,它的特点是对音频文件进行无损压缩,目前是被很多软件及智能硬件产品所支持. 从技术上来讲,该编解码的优点还是十分明显的,无损压缩,策略灵活,解码快速,硬件支持等特点都是 ...
常用音频协议介绍&&有关音频编码的知识与技术参数
(转载)常用音频协议介绍会议电视常用音频协议介绍及对比白皮书一.数字化音频原理:声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线.通常人耳可以听到的频率在20 ...
音频压缩编码 opus 附完整C++代码示例
绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码. 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10. 100KB 压缩后 10KB 虽然是有损压缩 ...
音频格式opus
人耳能听到自然界的声音是20HZ-20KHZ,一般高保真音质采样率只有达到最高采样率的2倍以上即可,平时电话采样率8KHZ,CD音质的采样率44.1KHZ. IBM 的Watson的音频转文字接口支持 ...
FFmpeg官方文档之————先进音频编码（AAC）
先进音频编码(AAC)的后继格式到MP3,和以MPEG-4部分3(ISO / IEC 14496-3)被定义.它通常用于MP4容器格式; 对于音乐,通常使用.m4a扩展名.第二最常见的用途是在MKV( ...
ffmpeg音频编码
在弄音频采集时,需要设置缓存的大小,如果只是简单的采集和直接播放PCM数据,缓存的大小一般不影响播放和保存. 但是,如果需要使用FFMpeg音频编码,这时,音频缓存的大小必须设置av_samples_ ...
silk与opencore-amr音频编码对比
silk与opencore-amr编码对比在采样率8000 单声道 16位采样精度情况下 silk的压缩率为 1/15 opencore-amr 1/17 对比图原始的音频编码 opencore- ...
音视频编解码技术（二）：AAC 音频编码技术
一.AAC编码概述 AAC是高级音频编码(Advanced Audio Coding)的缩写,出现于1997年,最初是基于MPEG-2的音频编码技术,目的是取代MP3格式.2000年,MPEG-4标准 ...
G.711是一种由国际电信联盟（ITU-T）制定的音频编码方式
http://zh.wikipedia.org/zh-cn/G.711 ITU-T G.711 page ITU-T G.191 software tools for speech and audio ...

随机推荐

Asynchronous MQTT client library for C （MQTT异步客户端C语言库-paho）
原文:http://www.eclipse.org/paho/files/mqttdoc/MQTTAsync/html/index.html MQTT异步客户端C语言库用于C的异步 MQTT 客 ...
web.config中配置数据库（多数据）连接的两种方式
这是我的第一篇文章,既然是第一篇了,那就从最基础的只是说起--web.config中配置数据库连接. 网上有很多这方面的资料,但发现并没有一篇从头到位很清楚明了说完的,今天就把我的整理写在这里吧. 在 ...
【python】递归（阶乘、斐波纳契、汉诺塔）
sqlserver 存储过程增加
CREATE PROCEDURE [dbo].[InsertMessage]( @strTable varchar(), --表名 @strValues nvarchar(), --要插入的数据(用英 ...
消息服务框架（MSF）应用实例之分布式事务三阶段提交协议的实现
一,分布式事务简介在当前互联网,大数据和人工智能的热潮中,传统企业也受到这一潮流的冲击,纷纷响应国家“互联网+”的战略号召,企业开始将越来越多的应用从公司内网迁移到云端和移动端,或者将之前孤立的IT ...
ABP .Net Core API和Angular前端APP独立部署跨域问题（No Access-Control-Allow-Origin）
前言: 通过ABP官网(https://aspnetboilerplate.com)下载ASP.NET Core 2.x + Angular模板项目是按ReStful风格架构Web API和angul ...
fuser命令使用心得
fuser命令可用于查看正使用指定file, file system, socket port的进程信息.使用-k参数可将这些进程杀掉,-i则在杀掉进程前给出提示例子: [root@bogon ~] ...
bzoj 1570: [JSOI2008]Blue Mary的旅行
Description 在一段时间之后,网络公司终于有了一定的知名度,也开始收到一些订单,其中最大的一宗来自B市.Blue Mary决定亲自去签下这份订单.为了节省旅行经费,他的某个金融顾问建议只购买 ...
Qt编写QUI皮肤生成器
用Qt写项目写多了,为了满足不同客户的需求,需要定制不同样式的界面,QUI皮肤生成器应运而生.思考这个工具的架构花了一年时间,如何从复杂的配色方案中提取出共性,然后将共性转为具体的QSS文件.思考架构 ...
KMP 算法 C++
#include <iostream>#include<string.h>#include<stdio.h>using namespace std; void Co ...

OGG的孩子-有损音频编码opus

OGG的孩子-有损音频编码opus的更多相关文章

随机推荐

热门专题