1 问题描述

这两天复现代码。先构造数据集，纯净语音、不同噪声、不同SNR的混合语音。其中纯净语音由两部分组成，IEEE corpus和TIMIT。

一开始我用MATLAB中的audioread读取音频文件，合成后用audiowrite保存下来。没有任何问题。

后来，师姐让我换成python处理，不管是wave还是scipy.io中的wavfile，在读取TIMIT的原始WAV时都会报错。

stackoverflow上相关问题及解决方案

2 原因定位

通过上述问答以及TIMIT语料库的官方说明文件，我们可以发现TIMIT中的WAV文件是：

我们用notepad++打开任意一个数据集中的wav文件，可以看到以下内容作为开头：

而以同样方式打开普通的wav文件，则开头内容为：

3 解决思路

将SPHERE文件转换成WAV文件。

网上可以找到许多方法，在此我采用了Dystopia在基于各种分类算法的说话人识别（年龄段识别）一文中的方法。

Kaldi中tools下有SPHERE文件转换工具sph2pipe.exe

1.下载编译sph2pipe

jacoxu的WSJ0数据中的.wv1文件(sph)读取

转换工具：sph2pipe_v2.5，如果安装过Kaldi的话，可以直接使用 $KALDI_ROOT/tools/sph2pipe_v2.5/sph2pipe，如果没有安装的话，可以单独下载：http://sourceforge.net/projects/kaldi/files/sph2pipe_v2.5.tar.gz

如果是在Windows环境下的话直接使用sph2pipe.exe即可，如果是在linux环境下的话，则需要进行GCC编码：gcc -o sph2pipe *.c -lm

2.用re_sph2pipe.py脚本生成sph2pipe转换文件

 #encoding="utf-8"

 import os

 import os.path

 rootdir = "/data/Datasets/yuanpp/TIMIT"

 timitpath = "/data/Datasets/yuanpp/TIMIT"

 targetpath = "/data/Datasets/yuanpp/TIMIT_convert"

 sph2pipepath = "/home/yuanpeipei/sph2pipe_v2.5/sph2pipe"

 f = open('./make_sph2pipe_file.txt','w')

 for root,dirs,files in os.walk(rootdir):

     for fn in files:

         if fn[len(fn)-3:len(fn)]=='wav':

             sourcefile = timitpath+root[len(rootdir):]+"/"+fn

             targetfile = targetpath + "/" + fn

             s = sph2pipepath + " -f wav " + sourcefile+" "+targetfile+"\n"

             f.write(s)

 f.close()

生成make_sph2pipe_file.txt文件，内容为命令行。

 /home/yuanpeipei/sph2pipe_v2.5/sph2pipe -f wav /data/Datasets/yuanpp/TIMIT/pure_utterance/validation/S_125_06.wav /data/Datasets/yuanpp/TIMIT_convert/S_125_06.wav

 /home/yuanpeipei/sph2pipe_v2.5/sph2pipe -f wav /data/Datasets/yuanpp/TIMIT/pure_utterance/validation/S_130_03.wav /data/Datasets/yuanpp/TIMIT_convert/S_130_03.wav

 /home/yuanpeipei/sph2pipe_v2.5/sph2pipe -f wav /data/Datasets/yuanpp/TIMIT/pure_utterance/validation/S_60_10.wav /data/Datasets/yuanpp/TIMIT_convert/S_60_10.wav

 /home/yuanpeipei/sph2pipe_v2.5/sph2pipe -f wav /data/Datasets/yuanpp/TIMIT/pure_utterance/validation/S_130_06.wav /data/Datasets/yuanpp/TIMIT_convert/S_130_06.wav

 ... ...

3.在linux下执行shell命令

 #!/bin/sh

 while read line

 do

   $line

 done < make_sph2pipe_file.txt

即可。

参考资料：

[1] 基于各种分类算法的说话人识别（年龄段识别）

[2] WSJ0数据中的.wv1文件(sph)读取

[3] reading a WAV file from TIMIT database in python

【数据预处理】TIMIT语料库WAV文件转换的更多相关文章

C++标准库实现WAV文件读写
在上一篇文章RIFF和WAVE音频文件格式中对WAV的文件格式做了介绍,本文将使用标准C++库实现对数据为PCM格式的WAV文件的读写操作,只使用标准C++库函数,不依赖于其他的库. WAV文件结构 ...
asterisk 语音文件转换
Centos wav to sln sox foo-in.wav -t raw -r 8000 -s -2 -c 1 foo-out.sln 当前目录下所有语音wav文件转换成sln for a i ...
WebRTC录音(2)-录音文件转换成WAV格式
以下是源码,大路货,从网上找的. 但是,这个东西在MacOS上是有问题的,原因在最后,都是泪啊. #include <stdio.h> #include <string.h> ...
WAV和PCM文件转换的程序
using System;using System.IO;using System.Text;using System.Windows.Forms;using System.Runtime.Inter ...
pcm数据生成wav文件
Qt由pcm数据生成wav文件 void AudioGrabber::saveWave(const QString &fileName, const QByteArray &raw, ...
WAV相关:从PCM16 Little Endian数据转WAV文件
数据格式 [0.0, -0.0, -0.0, 0.0, 0.0, 0.0, 5.960464477539063e-08, 5.960464477539063e-08, 1.19209289550781 ...
将任意音频格式文件转换成16K采样率16bit的wav文件
此转换需要使用ffmpeg 假设有目录 d:\录音目录有张三.m4a, 李四.m4a xxx.m4a(其他任意格式音频触类旁通可以把 *.m4a改成*.*).批量转换成采样率16K,有符号,16b ...
C#中使用WavHelper保存录音数据为wav文件
C#将录音数据文件保存为wav格式文件,这里使用到的是WavHelper工具类. WavHelper工具类: using System; using System.Collections.Generi ...
310实验室OTL问题----将写好的C++文件转换成Python文件，并将数据可视化
如图:文件夹第一处:optimizer文件夹下的:optimizer.h文件中添加你所写代码的头文件 #include <OTL/Optimizer/Reference-NSGA-II/Re ...

随机推荐

apue2e unp安装
最近在读 Richard Stevens 的大作<UNIX环境高级编程>,相信很多初读此书的人都会与我一样遇到这个问题,编译书中的程序实例时会出现问题,提示 “错误:apue.h:没有那个 ...
php使用urlencode对中文编码而引出的问题：urlencode和rawurlencode的区别
事件背景: 之前做h5小游戏,需要后端输出用户的相关信息给前端,输出的内容有:用户id,用户昵称等字段,使用get方式传参.后端使用PHP语言对中文昵称进行格式化编码,使用的是常用的urlencode ...
一个yum源for centos6.x
rpm -Uvh http://www.city-fan.org/ftp/contrib/yum-repo/city-fan.org-release-1-12.rhel6.noarch.rpm
react中手动重置redux
前段时间使用redux在react-native中,安卓后退两次关闭后redux未清空的问题,一直觉得处理的不够优雅,没有根本解决问题. 后来发现再退出登录后,也有部分数据因为redux的逻辑处理数据 ...
JavaWeb基础—JDBC入门
一.什么是JDBC JDBC全称为:Java Data Base Connectivity(java数据库连接),它主要由接口组成二.JDBC原理概述 JDBC原理:其实就是一组规范(就是对类的规范 ...
mfc 类的友元函数
知识点友元函数友元函数友元函数是指某些虽然不是类成员却能够访问类的所有成员的函数..类授予它的友元特别的访问权.通常同一个开发者会出于技术和非技术的原因,控制类的友元和成员函数(否则当你想更新你 ...
tkinter的GUI设计：界面与逻辑分离（三）-- 多页面
知识点: 使用 tkinter.Frame.tkraise() 函数去提升当前 tkinter.Frame 的 z 轴顺序,使得多个 tkinter.Frame 的可见性得以切换本文基于:win7 ...
Python day2 ---python基础2
本节内容列表. 元组操作购物车程序字符串操作字典操作 3级菜单作业(购物车优化) 1. 列表操作 1.定义列表names = ['Alex',"Tenglan",'Eri ...
【CQOI2014】数三角形
题面题解考虑使用总数减去不合法的数量首先将$n, m$都加上$1$,将网格变成坐标系总数即为$\large\binom{n\times m}{3}$ 不合法的有三种情况: 三个点在 ...
Kubernetes学习之路（八）之Kubeadm部署集群
一.环境说明节点名称 ip地址部署说明 Pod 网段 Service网段系统说明 k8s-master 192.168.56.11 docker.kubeadm.kubectl.kubelet ...

【数据预处理】TIMIT语料库WAV文件转换