基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法:
近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。
坦白讲,我精力有限,但一般都会抽空回复一下。
大多数情况,阅读一下代码就能解决的问题,
也是要尝试一下的。
没准,你就解决了呢?
WebRtc的采样算法本身就考虑到它的自身应用场景,
所以它会有一些局限性,例如不支持任意采样率等等。
而简洁插值的这个算法,
我个人也一直在使用,因为简洁明了,简单粗暴。
我自然也就没有进一步去细究采样算法,
当然网上还有不少开源的采样算法也是极其不错的。
一直也想抽时间再做一个兼顾简洁和质量的算法出来,不了了之。
最近一直在死磕傅里叶变换,网上的资源看了一箩筐。
徘徊到最后,毫无疑问FFTW3必须是你的首选,
从岁数性能以及使用的概率来说,当之无愧的王者。
当然也顺带整理一下,其他的一些FFT实现,各有优劣。
用于学习,作为参考资料也是不二之选。
有兴趣的小伙伴,可以参阅之.
https://github.com/cpuimage/StockhamFFT
https://github.com/cpuimage/uFFT
https://github.com/cpuimage/BluesteinCrz
https://github.com/cpuimage/fftw3
当然最佳的参考资料,还是fftw3,
我的这个git做了以下工作:
1.梳理调整目录结构
2.移除一些影响阅读调试,让人头大的宏定义
3.合并代码至fftw_api.c,移除一些不常用的代码
注意:未经过严格测试验证
也许这个git存在的意义在于方便众人阅读学习fftw的算法思路,
以及调试,扣代码等等诸如此类的行为。
所以有需要的同学可以,参考之。
回到本次的主题,
在以前做图像算法的时候,就一直在想一个问题,
是否可以利用傅里叶变换的特性进行图像的重采样呢?
这个一直是我心中的一个小石头,一直没放下。
从理论上来说,可行的,只是估计最终质量并不能保证。
最佳的尝试莫过于音频重采样,在很多时候,
我们经常需要对一个音频进行傅里叶变换,然后进行上采样或下采样的操作。
那是不是可以直接就在频域进行重采样呢?
这样的做法是不是质量就能有所保障呢?
事实证明,这是可行的。
经过简单试验,基于傅里叶变换的音频重采样算法就这样出炉了。
目前示例采用hsfft 这个开源傅里叶变换进行验证,
没有采用fftw3的原因也很简单,因为fftw3编译器来有点麻烦。
而hsfft的函数风格与fftw3类似,只是速度性能上不及fftw3而已。
这样也符合我的要求,真正应用的时候再使用fftw3替换之即可,
在验证思路的时候,没必要动用fftw3,
这也是我为什么使用简洁重采样的原因之一。
每个步骤都要有策略和方法,不必太过较真。
如果特定情况下需要,我也可以上matlab,python,delphi,c#,c++等等。
语言只是工具,关键还是思路和思想。
贴上主要代码:
#ifndef MIN
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#endif void FFTResample(float *input, float *output, int sizeIn, int sizeOut) {
fft_t *fftin = (fft_t *) calloc(sizeof(fft_t), sizeIn);
fft_t *fftout = (fft_t *) calloc(sizeof(fft_t), sizeOut);
if (fftin == NULL || fftout == NULL) {
if (fftout)
free(fftout);
if (fftin)
free(fftin);
return;
}
fft_real_object fftPlan = fft_real_init(sizeIn, );
fft_r2c_exec(fftPlan, input, fftin);
free_real_fft(fftPlan);
int halfIn = (sizeIn / ) + ;
int halfOut = (sizeOut / ) + ;
for (int i = ; i < MIN(halfIn, halfOut); ++i) {
fftout[i].re = fftin[i].re;
fftout[i].im = fftin[i].im;
}
fft_real_object ifftPlan = fft_real_init(sizeOut, -);
fft_c2r_exec(ifftPlan, fftout, output);
free_real_fft(ifftPlan);
float norm = .f / sizeIn;
for (int i = ; i < sizeOut; ++i) {
output[i] = (output[i] * norm);
}
free(fftout);
free(fftin);
}
算法非常简单,用一句时髦的语言来描述这个算法,就是“多退少补“。
需要补课FFT的可以移步:
项目地址:
https://github.com/cpuimage/fftResample
采用Cmake编译即可,示例代码也很简洁。
不多做解释了~
以上,权当抛砖引玉。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
基于傅里叶变换的音频重采样算法 (附完整c代码)的更多相关文章
- 基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
- 音频降噪算法 附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音 更加自然平滑,简而言之,美化. 图像算法和音频算法 都有其共通点. 图像是偏向 空间 处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
- mser 最大稳定极值区域(文字区域定位)算法 附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
- WebRTC 音频采样算法 附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
- 音频自动增益 与 静音检测 算法 附完整C代码
前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...
- 音频自动增益 与 静音检测 算法 附完整C代码【转】
转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...
- 自动曝光修复算法 附完整C代码
众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...
- 磨皮美颜算法 附完整C代码
前言 2017年底时候写了这篇<集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序> 这也算是学习过程中比较有成就感的一个算法. 自2015年做算法开始到今天,还有个把月 ...
- 音频压缩编码 opus 附完整C++代码示例
绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码. 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10. 100KB 压缩后 10KB 虽然是有损压缩 ...
随机推荐
- php解决高并发设想
1.我突然想到一个解决系统并发的一个方法, 当然不算太友好, 就是并发时候,首先加载系统负载量文件, 如果到达一个值,比如60%,就跳到404页面,或者输出稍后之类的这样 2.静态文件和图片存到cdn ...
- 获取Excel的单元格数据类型(靠谱)
VBA中,单元格属性有NumberFormat可以获取单元格格式,比如: G/通式格式→常规 @→文本 yyyy/m/d→日期 问题: G/通式格式,无法知道值是整数还是浮点数, yyyy/m/d如果 ...
- Json.Net 中Linq to JSON的操作
Linq to JSON是用来操作JSON对象的.可以用于快速查询,修改和创建JSON对象.当JSON对象内容比较复杂,而我们仅仅需要其中的一小部分数据时,可以考虑使用Linq to JSON来读取和 ...
- Oracle基础操作
数据库的定义.作用介绍: 什么是数据库? 按照数据结构来组织.存储和管理数据的建立在计算机存储设备上的仓库. 数据库的发展史: 起始于1962年,1968年在IBM出现 数据库在测试过程中的作用: 需 ...
- swagger使用二:swagger配置多个项目注释
在项目中采用swagger测试接口,提供接口给其他人员都非常的方便. 在swagger默认配置中,默认只显示接口访问层中的注释,可是很多的参数说明都已经在实体层中了啊?(如下图)不可能再把实体层中的模 ...
- C# Windows服务的安装和卸载批处理
@ECHO "请按任意键开始安装后台服务. . ."@ECHO "清理原有服务项. . ."%SystemRoot%\Microsoft.NET\Framewo ...
- empty() isset() isnull() 比较
有关 PHP 的 empty(),isset() 还有 is_null() 这三个函数的用法讨论得已经很多了,而且很多资料也未必能说得很清楚.这里再重复一次,但不是从概念去说,直接用程序例子来说话,应 ...
- BZOJ 2120 数颜色 【带修改莫队】
任意门:https://www.lydsy.com/JudgeOnline/problem.php?id=2120 2120: 数颜色 Time Limit: 6 Sec Memory Limit: ...
- 洛谷p1064 金明的预算方法
有附带条件的01背包 要那附件必须拿主件 因为一个主件最多有两个附件,所以每次遇到主件可能有四种选择 1.只拿主件 2.拿主件和一号附件 3.拿主件和二号附件 4.都拿 #include <cs ...
- Redis配置文件(3)常见的配置修改
常见的配置: redis.conf 配置项说明如下: 1. Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程 daemonize no 2. 当Redis以 ...