音频算法之小黄人变声 附完整C代码
前面提及到《大话音频变声原理 附简单示例代码》与《声音变调算法PitchShift(模拟汤姆猫) 附完整C++算法实现代码》
都稍微讲过变声的原理和具体实现。
大家都知道,算法从实现到最后工程应用,中间的环节和问题特别多。
尤其是编码的架构设计,好的数据结构和代码逻辑封装肯定是可复用,组件化的。
前几天写完《音频识别算法思考与阶段性小结》的时候,
我也提及到了。
会做一些算法编码优化相关的分享。
而有时候我总觉得文字表达很苍白,
所以我尽可能地把代码写得简洁易懂,
一方面是便于基础差的朋友学习。
另一方面也是为了自己在编码以及思考的时候,能更加清晰。
当然,变声算法绝大多数朋友都会选择一些开源的或者商业sdk去做二次开发。
例如:
https://www.surina.net/soundtouch/
但如果仅仅停留在使用的阶段,它就是一个黑盒子。
知其然,却不知其所以然。
是远远不够的。
有时候我们是要站在巨人的肩膀上去看到更美丽的风景。
但是,我希望是一群人,而不是一个人。
也许大家也发现了,我写的大多数算法,是纯c无第三方依赖的。
是不是就会怀疑,我就只会写c语言?
不是的,我所掌握的编程语言:
主要: c,c++,python,汇编
其次:pascal,c#,js,lua,go等
编程语言只是一个工具,关键还是算法思路。
用纯c写的主要目的,是为了破除一些第三方依赖,
不要一知半解地使用黑盒子。
当然,其次的好处就是跨平台,便携,可复用。
这样,一切了然于心。
为什么不可以造轮子呢?
只要你造的轮子是有用的,
不管是用于观赏用于学习还是其他用途。
在我了解到一些音频算法的思路之后,
变声算法的思路,
我觉得它的思路非常适用于扩展到大多数音频算法实现,
而且可复用度比较高。
所以,将它梳理开源,就显得特别有意义。
而大家可以基于这个实现,进一步去改进或者学习 音频算法,
例如降噪,增益等等。
因为这个编码实现的设计是完全可以适用到音频算法应用场景的。
逻辑也非常清晰。
项目地址:
https://github.com/cpuimage/pitchshift
当然为了便于一些朋友的学习使用,
示例代码提供一个简易的实现,
模拟变声为小黄人。
int main(int argc, char *argv[]) {
printf("Audio Processing \n");
printf("blog:http://cpuimage.cnblogs.com/ \n");
printf("Pitch Shifting Using The Fourier Transform\n");
if (argc < )
return -;
char *in_file = argv[];
uint32_t sampleRate = ;
uint64_t totalSampleCount = ;
uint32_t channels = ;
short *data_in = wavRead_s16(in_file, &sampleRate, &totalSampleCount, &channels);
if (data_in != NULL) {
float pitchShift = 0.9f;
size_t ms = ;
size_t overSampling = ;
size_t frameSize = sampleRate * ms / ;
frameSize += frameSize % ;
planData pitchPlanData = {};
double startTime = now();
makePlanData(frameSize, overSampling, sampleRate, &pitchPlanData);
pitchshift(pitchShift, data_in, data_in, totalSampleCount, &pitchPlanData);
// turn to minion pitch
{
totalSampleCount /= ;
short *samples = data_in;
for (int i = ; i < totalSampleCount; i++) {
data_in[i] = samples[];
samples += ;
}
}
double time_interval = calcElapsed(startTime, now());
freePlanData(&pitchPlanData);
printf("time interval: %f ms\n ", (time_interval * ));
}
char drive[];
char dir[];
char fname[];
char ext[];
char out_file[];
splitpath(in_file, drive, dir, fname, ext);
sprintf(out_file, "%s%s%s_out%s", drive, dir, fname, ext);
wavWrite_s16(out_file, data_in, sampleRate, totalSampleCount);
if (data_in) {
free(data_in);
}
printf("press any key to exit.\n");
getchar();
return ;
}
不做多解释,大家可以参阅pitchshift函数的实现,
主要实现位于文件PitchShift.h。
整个算法不到200行,逻辑非常清晰,
已经做了一定程度上的工程化优化。
当然还有很大的改进空间,
不过这份代码,更多的意义在于学习。
授人以鱼不如授人以渔。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
音频算法之小黄人变声 附完整C代码的更多相关文章
- css3实现小黄人
效果就像这样: 不废话,直接上代码! hrml代码: <!DOCTYPE html> <html> <head lang="zh"> <m ...
- 纯CSS3画出小黄人并实现动画效果
前言 前两天我刚发布了一篇CSS3实现小黄人动画的博客,但是实现的CSS3动画是基于我在站酷网找到的一张小黄人的jpg格式图片,并自己用PS抠出需要实现动画的部分,最后才完成的动画效果.但是,其实我的 ...
- [置顶]
几行代码实现ofo首页小黄人眼睛加速感应转动
最新版的ofo 小黄车的首页小黄人眼睛随重力而转动,感觉有点炫酷,学习一下吧,以下代码是在xamarin android下实现 ofo首页效果图: xamarin android实现效果: 实现思路: ...
- Python turtle模块小黄人程序
讲解Python初级课程的turtle模块,简单粗暴的编写了小黄人的程序.程序还需要进一步优化.难点就是要搞清楚turtle在绘制图形过程中的方向变化. import turtle t = turtl ...
- 小黄人IP营销的四种玩法思维导图
小黄人IP营销的四种玩法思维导图 ------------------------------ 本人微信公众帐号: 心禅道(xinchandao) 本人微信公众帐号:双色球预测合买(ssqyuce)
- CSS3实现小黄人动画
转载请注明出处,谢谢! 每次看到CSS3动画就心痒痒想试一下,记得一个多月前看了白树哥哥的一篇博客,突然开窍,于是拿他提供的demo试了一下,感觉很棒!下图为demo提供的动画帧设计稿. 自己也想说搞 ...
- 静态分析第三发 so文件分析(小黄人快跑)
本文作者:i春秋作家——HAI_ 0×00 工具 1.IDA pro 2.Android Killer 0×01 环境 小黄人快跑 下载地址http://download.csdn.net/downl ...
- CSS3小黄人
CSS3实现小黄人 效果图: 代码如下,复制即可使用: <!DOCTYPE HTML> <HTML> <head> <title>CSS3实现小黄人&l ...
- 微信小程序相关三、css写小黄人
小程序上课第三天,因为今天院里有活动,所以没去上课,第四天上午又因为要召开入党转正大会,又耽误了一上午,下午去上课,要了资料.这两天讲了一些零零碎碎的东西,做的实例有上面这个小黄人 都是用的css,基 ...
随机推荐
- CAShapeLayer的使用[2]
CAShapeLayer的使用[2] CAShapeLayer支持的动画类型有如下这些. ------------------------------------------------------- ...
- 使用 grep 的 -o 和 -E 选项进行正则的精确匹配
sed 命令可以很好的进行行匹配,但从某一行中精确匹配某些内容,则使用 grep 命令并辅以 -o 和 -E 选项可达到此目的.其中 -o 表示“only-matching”,即“仅匹配”之意.光用它 ...
- rsync- sersync -inotify
Rsync简介 Rsync是一款优秀的.快速的.多功能的本地或远程数据镜像同步备份工具.适用于unix/linux/windows等多种平台 从软件的名称Rsync(Remote Rynhroniza ...
- Power shell 复制文件到远程主机
昨天因为要复制文件到多个服务器上,感觉一个个复制很麻烦,我就想用Power shell 命令来完成这个任务.具体代码如下: $servers= 'server1' ,'server2' $userna ...
- [EffectiveC++]item13:Use objects to manage resources(RAII)
baidu百科 RAII 百科名片 RAII,也称为“资源获取就是初始化”,是c++等编程语言常用的管理资源.避免内存泄露的方法.它保证在任何情况下,使用对象时先构造对象,最后析构对象. 目录 RAI ...
- [BZOJ 2730][HNOI 2012] 矿场搭建
2730: [HNOI2012]矿场搭建 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2113 Solved: 979[Submit][Statu ...
- SDN第一次作业——关于网络编程
你会选择作网络编程方向的程序员吗?为什么? 我觉得我应该不会选择成为专门从事网络编程的程序员,因为我的从事计算机的理想一直是希望开发出自己的一款软件和游戏,所以应该是比较偏向软工方向的,也报了栋哥的软 ...
- JS数据模板分离(告别字符串拼接)-template
刚开始在写第一个动态网页的demo时,由于html不多,便使用字符串拼接的方法添加到dom来渲染,可是在后来写某外卖app时也需要如此添加,打开代码一看几千行,突然感觉累觉不爱 一行行的拼接有这功夫别 ...
- jq弹框 (1)内容自适应宽度 2(内容框显示,几秒后自动消失)
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&q ...
- Django settings.py 的media路径设置
转载自:http://www.xuebuyuan.com/676599.html 在一个 models 中使用 FileField 或 ImageField 需要以下步骤: 1. 在你的 settin ...