MFCC/Filter Bank的提取流程

- 预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。
- 分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为32ms,帧移为16ms。
- 加窗:采用汉明窗对一帧语音加窗,以减小吉布斯效应的影响。- 汉明窗,海明窗,是一个窗函数,这个函数在某一区间有非零值,而在其余区间皆为0。这是为了方便做快速傅里叶变换
 
- 快速傅立叶变换(Fast Fourier Transformation, FFT):将时域信号变换成为信号的功率谱(频域信号)。
- 梅尔滤波器组: 用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。 一般取40个三角滤波器,取对数后即40维fbank
- 求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。
- 离散余弦变换(Discrete Cosine Transformation, DCT,可选):去除各维信号之间的相关性(去相关),将信号映射到低维空间(从40维降到13维)。 若去除这一步,得到的则是Filter Bank特征,因为dnn模型可以学习特征间的相关性,因此不需要去相关性的操作。
- 得到MFCC或Filter Bank
- Delta差分:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能。在本系统中,我们也用到了MFCC参数的一阶差分参数(Delta-Delta)和二阶差分参数(Delta-Delta+Delta)。
MFCC/Filter Bank的提取流程的更多相关文章
- MFCC特征参数提取流程概述
		一 概念概述: 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequenc ... 
- filter 过滤器加载流程
		过滤器例子 <!--A过滤器--><filter> <filter-name>mdamptRightLimitFilter</filter-name> ... 
- 语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现
		梅尔倒谱系数(MFCC) 梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC).依据人的听觉实验结果来分析语音的频谱, MFCC分析依据的听觉 ... 
- 立体像对DEM提取
		版权声明:本教程涉及到的数据仅练习使用,禁止用于商业用途. 目录 1.概述 2.详细操作步骤 第一步:输入立体像对 第二步:定义地面控制点 第三步:定义连接点 第四步:设定DEM提取参数 第五步:输出 ... 
- 神奇的 SQL 之 WHERE 条件的提取与应用
		开心一刻 小明:为什么中国人结婚非要选一个好日子呢 ? 楼主:嗯 ? 那肯定啊,结完婚之后你还能有好日子吗 ? 小明:那结婚时所说的白头到老是真的吗 ? 楼主:这哪能是真的,你看现在,头发还没白就秃了 ... 
- Filter介绍
		Filter可人为是Servlet的一种“加强版”,它重要用于对用户请求进行预处理,也可以对HttpServletResponse进行后处理,是个典型的处理链.使用Filter的完整的流程是:Filt ... 
- C++实现网格水印之调试笔记(五)—— 提取出错
		在实现提取水印的过程中,遇到了一些问题 首先还是根据论文中的思路来梳理一下整个提取流程 读入两个模型,一个原始模型ori_mesh, 一个水印模型wm_mesh. 将两个模型对齐(即放在同一个坐标系下 ... 
- 基于TF-IDF的新闻标签提取
		基于TF-IDF的新闻标签提取 1. 新闻标签 新闻标签是一条新闻的关键字,可以由编辑上传,或者通过机器提取.新闻标签的提取主要用于推荐系统中,所以,提取的准确性影响推荐系统的有效性.同时,对于将标签 ... 
- (二)ORB描述子提取源码思路与实现
		ORBSLAM2中ORB特征提取的特点 ORBSLAM2中通过对OpenCV中的ORB特征点提取类进行修改,对图像进行分块提取,而后划分节点,使得每个节点中保存的特征点性能是该节点所有特征点中最好的. ... 
随机推荐
- 【洛谷P4318】完全平方数
			题目大意:求第 K 个无平方因子数. 题解:第 k 小/大的问题一般采用二分的方式,通过判定从 1 到当前数中满足某一条件的数有多少个来进行对上下边界的转移. 考虑莫比乌斯函数的定义,根据函数值将整数 ... 
- 你应该要知道的vue.js
			前言 小组同事最近都在学习前端,目前我们小组前端技术栈主要是vue.在和同事交流过程成,发现他们对vue都不了解,所以整理了问的比较多的问题. 组件data为什么必须是函数? 因为组件可能被多处使用, ... 
- [bzoj1692][队列变换]
			题目链接 思路 首先肯定想到贪心,从队尾和队首取更小的那个. 但是如果遇到队尾和队首一样大的情况呢,总不能再挨个往前比较.所以就把整个字符串倒过来再挂到现在字符串的后面,也就是把当前字符串对称过去.然 ... 
- 腾讯云centos7安装MySQL
			centos就centos呗,为什么要加个腾讯云呢?有这种疑问的兄dei,一定是没被不同云的系统坑过啊,阿里云的Ubuntu和腾讯云的Ubuntu不一样,centos好像也有差别,各个云平台,同样的系 ... 
- django引入模板时,部分css文件渲染不成功失灵引入不成功
			今天碰到了一件怪事,下载好的模板,在webstorm中就好好地,但是一引入到pycharm的django项目中就各种失灵,位置错乱. 检查一番,发现该设置的都设置对了啊,而且js文件和css文件还有一 ... 
- Day11--Python--函数名,闭包,迭代器
			通过 lst.__iter__()拿到lst.的迭代器 1.函数名第一类对象 函数名就是变量名 1.函数名可以像变量一样互相赋值. 2.可以作为函数的参数,进行传递 3.可以作为返回值返回 4.可以作 ... 
- 自定义QMenu
			参考: http://blog.csdn.net/qq1623803207/article/details/77449884 http://blog.sina.com.cn/s/blog_a6fb6c ... 
- C++的静态成员变量使用方法
			main.cpp:(.text._ZN6Object4useSEv[_ZN6Object4useSEv]+0x1a):对‘Object::i’未定义的引用 常用Java不懂C++的静态方法使用方式.尝 ... 
- vue 本地存储数据 sessionStorage
			在vuex 下的 action下的userAction.js中添加 export function login(from, self) { axPost('/api/login', from, fun ... 
- java和c#值类型和引用类型
			java数据类型分为基本数据类型和引用类型 基本数据类型:int float double bool char byte 引用数据类型:string array class interfa ... 
