基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法:
近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。
坦白讲,我精力有限,但一般都会抽空回复一下。
大多数情况,阅读一下代码就能解决的问题,
也是要尝试一下的。
没准,你就解决了呢?
WebRtc的采样算法本身就考虑到它的自身应用场景,
所以它会有一些局限性,例如不支持任意采样率等等。
而简洁插值的这个算法,
我个人也一直在使用,因为简洁明了,简单粗暴。
我自然也就没有进一步去细究采样算法,
当然网上还有不少开源的采样算法也是极其不错的。
一直也想抽时间再做一个兼顾简洁和质量的算法出来,不了了之。
最近一直在死磕傅里叶变换,网上的资源看了一箩筐。
徘徊到最后,毫无疑问FFTW3必须是你的首选,
从岁数性能以及使用的概率来说,当之无愧的王者。
当然也顺带整理一下,其他的一些FFT实现,各有优劣。
用于学习,作为参考资料也是不二之选。
有兴趣的小伙伴,可以参阅之.
https://github.com/cpuimage/StockhamFFT
https://github.com/cpuimage/uFFT
https://github.com/cpuimage/BluesteinCrz
https://github.com/cpuimage/fftw3
当然最佳的参考资料,还是fftw3,
我的这个git做了以下工作:
1.梳理调整目录结构
2.移除一些影响阅读调试,让人头大的宏定义
3.合并代码至fftw_api.c,移除一些不常用的代码
注意:未经过严格测试验证
也许这个git存在的意义在于方便众人阅读学习fftw的算法思路,
以及调试,扣代码等等诸如此类的行为。
所以有需要的同学可以,参考之。
回到本次的主题,
在以前做图像算法的时候,就一直在想一个问题,
是否可以利用傅里叶变换的特性进行图像的重采样呢?
这个一直是我心中的一个小石头,一直没放下。
从理论上来说,可行的,只是估计最终质量并不能保证。
最佳的尝试莫过于音频重采样,在很多时候,
我们经常需要对一个音频进行傅里叶变换,然后进行上采样或下采样的操作。
那是不是可以直接就在频域进行重采样呢?
这样的做法是不是质量就能有所保障呢?
事实证明,这是可行的。
经过简单试验,基于傅里叶变换的音频重采样算法就这样出炉了。
目前示例采用hsfft 这个开源傅里叶变换进行验证,
没有采用fftw3的原因也很简单,因为fftw3编译器来有点麻烦。
而hsfft的函数风格与fftw3类似,只是速度性能上不及fftw3而已。
这样也符合我的要求,真正应用的时候再使用fftw3替换之即可,
在验证思路的时候,没必要动用fftw3,
这也是我为什么使用简洁重采样的原因之一。
每个步骤都要有策略和方法,不必太过较真。
如果特定情况下需要,我也可以上matlab,python,delphi,c#,c++等等。
语言只是工具,关键还是思路和思想。
贴上主要代码:
#ifndef MIN
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#endif void FFTResample(float *input, float *output, int sizeIn, int sizeOut) {
fft_t *fftin = (fft_t *) calloc(sizeof(fft_t), sizeIn);
fft_t *fftout = (fft_t *) calloc(sizeof(fft_t), sizeOut);
if (fftin == NULL || fftout == NULL) {
if (fftout)
free(fftout);
if (fftin)
free(fftin);
return;
}
fft_real_object fftPlan = fft_real_init(sizeIn, );
fft_r2c_exec(fftPlan, input, fftin);
free_real_fft(fftPlan);
int halfIn = (sizeIn / ) + ;
int halfOut = (sizeOut / ) + ;
for (int i = ; i < MIN(halfIn, halfOut); ++i) {
fftout[i].re = fftin[i].re;
fftout[i].im = fftin[i].im;
}
fft_real_object ifftPlan = fft_real_init(sizeOut, -);
fft_c2r_exec(ifftPlan, fftout, output);
free_real_fft(ifftPlan);
float norm = .f / sizeIn;
for (int i = ; i < sizeOut; ++i) {
output[i] = (output[i] * norm);
}
free(fftout);
free(fftin);
}
算法非常简单,用一句时髦的语言来描述这个算法,就是“多退少补“。
需要补课FFT的可以移步:
项目地址:
https://github.com/cpuimage/fftResample
采用Cmake编译即可,示例代码也很简洁。
不多做解释了~
以上,权当抛砖引玉。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
基于傅里叶变换的音频重采样算法 (附完整c代码)的更多相关文章
- 基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
- 音频降噪算法 附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音 更加自然平滑,简而言之,美化. 图像算法和音频算法 都有其共通点. 图像是偏向 空间 处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
- mser 最大稳定极值区域(文字区域定位)算法 附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
- WebRTC 音频采样算法 附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
- 音频自动增益 与 静音检测 算法 附完整C代码
前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...
- 音频自动增益 与 静音检测 算法 附完整C代码【转】
转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...
- 自动曝光修复算法 附完整C代码
众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...
- 磨皮美颜算法 附完整C代码
前言 2017年底时候写了这篇<集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序> 这也算是学习过程中比较有成就感的一个算法. 自2015年做算法开始到今天,还有个把月 ...
- 音频压缩编码 opus 附完整C++代码示例
绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码. 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10. 100KB 压缩后 10KB 虽然是有损压缩 ...
随机推荐
- 使用burpsuite对移动app抓包分析
测试移动APP的联网请求,需要获取路径或者参数的时候,使用该工具burpsuite非常方便! 要求: 移动终端和PC处于同一个wlan环境下 第一步:获取本地地址,cmd-->ipconfig ...
- ubuntu16.4安装php7+apache2+mysql环境全过程记录
1.安装apache2 sudo apt-get install apache2 2.安装php7 sudo apt-get install php7.0 3.apache 识别php插件(不是必须, ...
- java学习第一步,使用IntelliJ IDEA编写自己的第一个java程序
首先下载java的jdk,然后说一下IDEA的配置 IntelliJ IDEA目前公认的最好的java开发工具,不过一般的学校的教学还是使用eclipse来进行java的开发.所以老师一般只会教你如何 ...
- BZOJ 1878 [SDOI2009]HH的项链 【莫队】
任意门:https://www.lydsy.com/JudgeOnline/problem.php?id=1878 1878: [SDOI2009]HH的项链 Time Limit: 4 Sec M ...
- PowerShell交互下的热键
- Kali-linux测试网络范围
测试网络范围内的IP地址或域名也是渗透测试的一个重要部分.通过测试网络范围内的IP地址或域名,确定是否有人入侵自己的网络中并损害系统.不少单位选择仅对局部IP基础架构进行渗透测试,但从现在的安全形势来 ...
- logback配置与使用(2)
转载:yaoh371 的logback.xml常用配置 <?xml version="1.0" encoding="UTF-8"?> <!-- ...
- Tomcat整体介绍
来源 本文整理自 <Tomcat内核设计剖析>.<Tomcat结构解析> Tomcat 整体架构 如上图所示:包含了Tomcat内部的主要组件,每个组件之间的层次包含关系很 ...
- Python嵌套列表去重
raw_list = [ [ 'CS_SUPP_INFO', 'A', '1'], [ 'CS_SUPP_INFO', '1', 'A'], [ 'CS_SUPP_INFO', '1', 'A'], ...
- jquery实现顶部浮动效果
示例: <!DOCTYPE html> <html> <head> <meta charset="UTF-8" /> <tit ...