OLA音频变速算法的仿真与剖析

前段时间，在尝试音乐节拍数的提取时，终于有了突破性的进展，效果基本上比市面上的许多商业软件还要好，在作节拍数检测时，高频信息作用不大，

通过重采样减小运算量。重采样让我想起了在学校里面做的变速变调算法，在这里顺便回顾一下。

OLA(Overlap-and-Add, OLA)重叠叠加算法是音频变速算法中最简单的时域方法，它是后续时域算法(SOLA, SOLA-FS, TD-PSOLA, WSOLA)的基础。

OLA分为分解与合成两个部分，公式看起来很复杂，所以不贴出了，基本思路从图中更能清晰的表现出来。

分解阶段：语音首先分帧，帧长为N，假设帧移为Sa。

合成阶段：分解出来的语音帧，以帧移为Ss的间隔重新合成起来，得到变速之后的音频。

Rate = Ss/ Sa，如果Sa=Ss，则原速；Ss<Sa时，加速；Ss>Sa时，减速。

功能性代码：

function [ RSound ] = OLA(Speech, Fs, Rate)

%OLA Summary of this function goes here

%   Detailed explanation goes here

    frame_ms = 25;

    frame_len = frame_ms * Fs /1000;

    window = hanning(frame_len);

    Sa = 1/2 * frame_len;

    AnalysisSplice = enframe(Speech, window, Sa);

    AnalysisSplice = AnalysisSplice';%each column corresponding to each frame data

    Ss = Rate*Sa;

    RSound = Synthesis(AnalysisSplice, Ss);

end

function  RSound = Synthesis(AnalysisSplice, Ss)

    [frame_len, nframes] = size(AnalysisSplice);

    N = Ss*(nframes - 1) + frame_len;

    RSound = zeros(1, N);

    for q = 1:nframes

       RSound(1 + (q-1)* Ss : frame_len + (q-1)*Ss) = RSound(1 + (q-1)* Ss   :  frame_len + (q-1)*Ss) +  AnalysisSplice(:,q)';

    end

end

Script执行代码：

clc;

clear;

close all;

Path = 'D:\Experiment\OLA\';

file = [Path, 'test.wav'];

faster = [Path, 'faster.wav'];

[Speech, Fs] = wavread(file);

Rate = 0.7;

%wavread wavwrite enframe function comes from voicebox tools

RSound = OLA(Speech,Fs,Rate);

wavwrite(RSound,Fs,faster);

figure;

subplot(2,1,1);

plot(Speech);

title('original');

axis([1 length(Speech) -0.5 0.5]);

subplot(2,1,2);

plot(RSound);

title('0.7 faster');

axis([1 length(Speech) -0.5 0.5]);

变速前后的时域波形对比图

OLA算法在重叠部分会造成基频断裂，甚至语音失真。所以后期许多算法基于此缺点进行了相关的改进。

测试文件：

http://pan.baidu.com/s/1hq4540G

来自：http://www.cnblogs.com/welen

http://blog.csdn.net/weiqiwu1986

OLA音频变速算法的仿真与剖析的更多相关文章

基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
WebRTC 音频采样算法附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
音频降噪算法附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音更加自然平滑,简而言之,美化. 图像算法和音频算法都有其共通点. 图像是偏向空间处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法: WebRTC 音频采样算法附完整C++示例代码简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题. 坦白讲, ...
一种简单高效的音频降噪算法示例(附完整C代码)
近期比较忙, 抽空出来5.1开源献礼. 但凡学习音频降噪算法的朋友,肯定看过一个算法. <<语音增强-理论与实践>> 中提及到基于对数的最小均方误差的降噪算法,也就是LogMM ...
java使用Sonic 算法对音频变速不变声、变调、调整音量
依赖库:https://github.com/waywardgeek/sonic 基础库:Sonic.java /* Sonic library Copyright 2010, 2011 Bill C ...
简洁明了的插值音频重采样算法例子 (附完整C代码)
近一段时间在图像算法以及音频算法之间来回游走. 经常有一些需求,需要将音频进行采样转码处理. 现有的知名开源库,诸如: webrtc , sox等, 代码阅读起来实在闹心. 而音频重采样其实也就是插值 ...
soundtouch 变速算法matlab实现
soundtouch变速主要采用WSOLA算法来进行变速. http://www.surina.net/soundtouch/ https://blog.csdn.net/suhetao/articl ...
图像处理算法的仿真平台之VGA时序
一概述图像处理算法一般是用matla或OpenCV实现的,若是用FPGA实现,设计思路差别极大.matlab和opencv的优势:这些工具的优势在于可以方便地载入图像文件,或输出数据到图像文件, ...

随机推荐

h5移动端滑动的细节
1.获取手指滑动的长度: var hasTouch = 'ontouchstart' in window && !isTouchPad, _start:function(e){ var ...
vertical-align0 垂直对齐- 图片兼容个浏览器
效果: 代码: <html> <head> <style type="text/css"> img.top {vertical-align:t ...
404. Sum of Left Leaves
Find the sum of all left leaves in a given binary tree. 左树的值(9+15=24) /** * Definition for a binary ...
C# ManualResetEvent和AutoResetEvent 使用笔记
一.两者区别 1.ManualResetEvent 调用一次Set()后将允许恢复所有被阻塞线程.需手动在调用WaitOne()之后调用Reset()重置信号量状态为非终止,然后再次调用WaitOne ...
[MongoDB]可视化工具Robomongo
摘要习惯了可视化的管理数据的方式,通过敲命令,确实有些不自在.这里推荐一个mongodb的可视化工具——Robomongo 相关文章 [MongoDB]入门操作 [MongoDB]增删改查 [Mon ...
【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
oracle中的连接查询与合并查询总结
连接查询: 连接查询是指基于多张表或视图的查询.使用连接查询时,应指定有效的查询条件,不然可能会导致生成笛卡尔积.如现有部门表dept,员工表emp,以下查询因查询条件无效,而产生笛卡尔积: (各 ...
Nginx 502 bad gateway问题的解决方法
Nginx 502 Bad Gateway的含义是请求的PHP-CGI已经执行,但是由于某种原因(一般是读取资源的问题)没有执行完毕而导致PHP-CGI进程终止,一般来说Nginx 502 Bad G ...
sqoop
http://blog.csdn.net/yfkiss/article/details/8700480 http://www.cnblogs.com/admln/p/sqoop1-99-4-javaa ...
NHibernate配置
因为NHibernate被设计为可以在许多不同环境下工作,所以它有很多配置参数.幸运的是,大部分都已经有默认值了. NHibernate.Test.dll包含了一个示例的配置文件app.config, ...

OLA音频变速算法的仿真与剖析

OLA音频变速算法的仿真与剖析的更多相关文章

随机推荐

热门专题