音频音量调整中的ramp up & down

在日常生活中不管是打电话还是听音乐，都会遇到音量不合适而去调整音量的情况。如果音量调整软件处理不好，就会听到pop noise。产生pop noise的原因是音量直接从当前值骤变到目标值，而不是缓慢的变。如果缓慢的变就不会有pop noise了。图1显示的是音量变大时骤变和缓慢变的示意图。图2显示的是音量变小时骤变和缓慢变的示意图。

在技术上音量缓升叫ramp up，音量缓降叫ramp down。本文就讲讲如何处理好ramp up & ramp down。

音量调整也叫增益（gain）调整。音量的单位是dB，计算公式是dB = 20*log(gain) 。gain = Y/X ，X是原始PCM值，Y是音量变后的PCM值。当音量不变时，即Y = X或者gain = 1，就是0 dB（20 *log(1) = 0 dB）。通常每增加6dB音量就翻倍，即Y = 2X或者gain = 2，（20 *log(2) = 6.02 dB）。通常音量变化范围是-88dB~12dB。软件实现时用的却是gain，因此要从dB换算成gain。由上面的计算dB的公式可以得到gain，gain = 10^dB/20。为了减少运行时的运算量，就把音量(dB)和gain之间的mapping做成table。运行时只要根据dB值查表得到gain值。下表做了一个简单的示例。

float gain[101] = {

0.0000398， // -88 dB

0.0000447, // -87 dB

…..

1.0, // 0 dB

…..

2.0, // 6 dB

…..

}；

原始PCM值乘以gain就是变化后的PCM值了，即 Y = X * gain。

音频处理算法通常都是定点实现的，这样就需要把gain table定点化，以Q4.27为例，得到下表的示例。

Int gain[101] = {

5343, // -88 dB

5995, // -87 dB

…..

134217728 , // 0 dB

…..

267799575, // 6 dB

…

}；

在音量ramp过程中，要想做好ramp up & down，ramp过程中每个采样点的gain都是不一样的，从当前的gain值逐渐变到目标gain值。首先得定好指标：1ms变化多少dB（定义为dBPerMS）, 这个确定了就可算出需要多少毫秒从当前音量变到目标音量。例如指标是1ms变化1dB，那么音量要从0dB变到12dB就需要12ms。采样率不同，1ms内的采样点数也不一样（定义为samplesPerMS）。以8K采样率为例，1ms内有8个采样点，即samplesPerMS = 8。知道了dBPerMS和samplesPerMS，就可算出每个采样点变化的dB，即 dBPerMS/samplesPerMS，记为ΔdB。上面算出的是ramp up时的值，当ramp down时，就是-ΔdB。

在ramp过程中假设当前采样点的音量为N dB，对应的gain记为g1，则下个采样点的音量为(N + Δ) dB，对应的gain记为g2。可以得到如下两个表达式：

N = 20 * log(g1) (1)

N + Δ = 20 * log(g2) (2)

(2)式 - (1)式得式（3）

Δ = 20 * log(g2) - 20 * log(g1) = 20 * log(g2/g1) (3)

所以

log(g2/g1) = Δ/20 , g2/g1 = 10^Δ/20 , g2 = g1 * 10^Δ/20 (4)

这样就得到了下个采样点的gain（g2）与当前采样点的gain（g1）的数学表达式(式4)。当g2的值到达目标gain时就不再更新。10^Δ/20可以称为ramp factor，事先把这个值算好，在软件中做定值用。在不同的指标和采样率下有不同的值。例如dBPerMS = 0.5，samplesPerMS = 48，则Δ/20 = 0.0005208，rampUpFactor = 10^Δ/20 = 1.0012，rampDownFactor = 10^-Δ/20 = 0.9988。Ramp factor确定后就可去做gain更新了。以从0dB ramp up到6dB ramp factor是1.0012为例，0 dB时gain是1，6dB时目标gain是2。算每个采样点时当前采样点的gain都是前一个采样点gain的1.0012倍，一直到gain达到2后保持不变。

图3和图4是以正弦波为例做ramp up & down的原PCM和ramp后的PCM。

图3 原PCM波形和频谱

图4 ramp up & down后的波形和频谱

对上两图做一下解释。处理的是双声道的48k 采样的正弦波。通常声音刚开始播放时为了避免pop noise，会做一个ramp up，把音量从-88dB逐渐调整到0dB。30帧（每帧10ms）时，把音量调整到3dB，是个ramp up的过程。60帧时设成mute(mute是常见的一个场景，它可以算是音量调整中一个特例。mute时相当于把音量从当前值变为-88dB，unmute时就相当于把音量从-88dB变回去)，是个ramp down的过程，几乎就听不到声音了。90帧时把音量设成0dB, 由于这时还处于mute，不生效，但音量值记住了。120帧时设成unmute，是个ramp up的过程，音量逐步变成0dB。150帧时把音量设成-6dB，是个ramp down的过程。

音频音量调整中的ramp up & down的更多相关文章

千位分隔符，音频音量加强，transform 垂直居中
1.最近做阴阳师日本官网,其中有个功能是获取预约人数,设计稿上的人数是这样151,567,000,想了想自己写还有点麻烦,于是网上copy了代码,再修改了下. 其中,有一点需要注意的是:函数中的str ...
//点击按钮加减音频音量到最小会出现bug什么意思？？？
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
WebRTC与音频音量
WebRTC打开麦克风,获取音频,在网页上显示音量. 播放示例音频先从播放音频入手.准备一个现成的音频文件. 界面上放一个audio元素,提前准备好一个音频文件,路径填入src <audio ...
iOS音频采集过程中的音效实现
1.背景在移动直播中, 声音是主播和观众互动的重要途径之一, 为了丰富直播的内容,大家都会想要在声音上做一些文章, 在采集录音的基础上玩一些花样. 比如演唱类的直播间中, 主播伴随着背景音乐演唱. ...
音频软件开发中的debug方法和工具
本文系作者原创.如转载,请注明出处. 谢谢! 音频软件开发同其他软件开发一样,都需要去调试.音频软件调试同其他软件调试方法有相同的地方,也有不同的地方,同时调试时还需要借助一些专门的工具,有了这些方法 ...
C++ 调节PCM音频音量大小
在用解码器解码音频数据得到PCM音频数据块之后,可以在将数据送给声卡播放之前调节其音量大小,具体的实现函数如下: void RaiseVolume(char* buf, UINT32 size, UI ...
音频算法speex中的aec分析以及解析
算法原理: Speex的AEC是以NLMS(Normalized Least Mean Square)为基础,用MDF(multidelay block frequency domain)频域实现,最 ...
alsa音频播放过程中的基本概念
以下为 ALSA-Project/FramesPeriods[1] 学习笔记 1, sample_rate: 即每秒进行多少次采样,常见的比如 8000.16000.44100和48000等 2, s ...
Python-气象-大气科学-可视化绘图系列（三）—— 地图上自动标注省会名称（demo调整中）（代码+示例）
本文为原创文章本文链接:https://www.cnblogs.com/zhanling/p/12606990.html # -*- coding: utf-8 -*- ''' Author: He ...
moviepy音视频开发：audio_normalize调整剪辑音量大小到正常
☞ ░ 前往老猿Python博文目录 ░ 概述 audio_normalize函数用于将一个剪辑的音量大小调整到正常,调整的思路就是将剪辑中音频帧数据的最大值取出来,当其值小于1时,表示剪辑的音量偏小 ...

随机推荐

python的微积分运算
import sympy sympy.init_printing() from sympy import I, pi, oo import numpy as np 求函数的导数 x = sympy.S ...
驱动开发：内核运用LoadImage屏蔽驱动
在笔者上一篇文章<驱动开发:内核监视LoadImage映像回调>中LyShark简单介绍了如何通过PsSetLoadImageNotifyRoutine函数注册回调来监视驱动模块的加载,注 ...
分清国内版FireFox和国际版FireFox
FireFox现在成为越来越多人替代Chrome的选择.但与Chrome不同的是,FireFox无论桌面端还是移动端,都有着『国际』和『国内』版本的区分. 二.正确的下载地址 2.1国内版的混淆视听: ...
Python处理刚刚，分钟，小时，天前等时间
简介用爬虫获取目标网站数据后可能会遇见时间为处理刚刚,分钟,小时,天前等时间格式,如图解决问题: 写了一个工具类来处理该问题,其中封装了两个函数 1. 将时间中的中文数字转换成阿拉伯数字 def ...
JS数据结构与算法-概述
JS数据结构与算法概述数据结构: 计算机存储, 组织数据的方式, 就像锅碗瓢盆算法: 一系列解决问题的清晰指令, 就像食谱两者关系: 程序 = 数据结构 + 算法邂逅数据结构与算法什么是数据 ...
一、Redis的Java客户端
模糊的目标,要不断去解释它们,把他们转化成一个更具体的内容,这样才能够找到途径. 常用客户端介绍 Jedis客户端基本使用(直连) 引入对应依赖 <dependency> <gro ...
Go语言核心36讲22
你好,我是郝林,今天我们继续来分享错误处理. 在上一篇文章中,我们主要讨论的是从使用者的角度看"怎样处理好错误值".那么,接下来我们需要关注的,就是站在建造者的角度,去关心&quo ...
MongoDB - 索引知识
索引简介什么是索引索引最常用的比喻就是书籍的目录,查询索引就像查询一本书的目录. 索引支持 MongoDB 查询的高效执行.如果没有索引,MongoDB 必须扫描集合中每一个文档,以选择与查询语句 ...
读Bilgin Ibryam 新作《Dapr 是一种10倍数平台》
Bilgin Ibryam 最近加入了开发者软件初创公司Diagrid Inc,他是Apache Software Foundation 的 committer 和成员.他也是一个开源的布道师,并且是 ...
Day18.2：对象创建的内存分析图解
对象创建的内存分析我们从两块最常用的内存空间对对象创建进行内存分析堆内存:存放的是对象的具体信息:在程序之中堆内存空间的开辟是通过new完成的栈内存:存放的是对象的地址信息,即通过地址找到堆内存 ...

音频音量调整中的ramp up & down

音频音量调整中的ramp up & down的更多相关文章

随机推荐

热门专题