最近在研究speex的编码和解码流程

之前在IM上用到的都是发语音片段,这个很简单,只需要找到googlecode上gauss的代码,然后套一下就可以用了。

不过googlecode要关闭,有人将他导入到了github,地址在这里 https://github.com/cczufish/OggSpeex-android

我也导入了,但是没成功,不知道什么问题,可能级别不够吧,哈哈 https://github.com/dongweiq/android-recorder

现在我们的需求是要求将语音片段拼接合成,而且要在UI中显示出正在播放的时间,看了gauss的代码后发现,他的代码是边解码边播放的,按照的是short[160]的片段一个个播放的

 /* decode each segment, writing output to wav */
for (curseg = 0; curseg < segments; curseg++) { if (Thread.interrupted()) {
dis.close();
track.stop();
track.release();
return;
} while (this.isPaused()) {
track.stop();
track.release();
// Thread.sleep(100);
} /* get the number of bytes in the segment */
bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF;
if (bodybytes == 255) {
System.err.println("sorry, don't handle 255 sizes!");
return;
}
dis.readFully(payload, 0, bodybytes);
chksum = OggCrc.checksum(chksum, payload, 0, bodybytes); /* decode the segment */
/* if first packet, read the Speex header */
if (packetNo == 0) {
if (readSpeexHeader(payload, 0, bodybytes, true)) {
packetNo++;
} else {
packetNo = 0;
}
} else if (packetNo == 1) { // Ogg Comment packet
packetNo++;
} else { /* get the amount of decoded data */
short[] decoded = new short[160];
if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) {
track.write(decoded, 0, decsize);
float maxVol = AudioTrack.getMaxVolume();
track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小
track.play();
}
packetNo++;
}
}

而且他还有一个包序号,pacetNo为0则是speex的文件头,占80字节,packetNo为1则查找包序号2,2中就按照160short解码音频,然后播放解码后的wav。

后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/

相当于是对整个speex编码和解码的过程的总结吧

一:编码流程
使用Speex的API函数对音频数据进行压缩编码要经过如下步骤:
1、定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。
2、调用speex_bits_init(&bits)初始化bits。
3、调用speex_encoder_init(&speex_nb_mode)来初始 化enc_state。其中speex_nb_mode是SpeexMode类型的变量,表示的是窄带模式。还有speex_wb_mode表示宽带模 式、speex_uwb_mode表示超宽带模式。
4、调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数,其中参数state表示编码器的状态;参数request表示要定义的参数类型,如SPEEX_ GET_ FRAME_SIZE表示设置帧大小,SPEEX_ SET_QUALITY表示量化大小,这决定了编码的质量;参数ptr表示要设定的值。
可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。
5、初始化完毕后,对每一帧声音作如下处理:调用函数 speex_bits_reset(&bits)再次设定SpeexBits,然后调用函数speex_encode(enc_state, input_frame, &bits),参数bits中保存编码后的数据流。
6、编码结束后,调用函数speex_bits_destroy (&bits),    speex_encoder_destroy (enc_state)来
二:解码流程
同样,对已经编码过的音频数据进行解码要经过以下步骤:
1、     定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。
2、   调用speex_bits_init(&bits)初始化bits。
3、   调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。
4、    调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。
5、   调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码,参数out中保存解码后的数据流。
6、   调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。
 
下面是一段实例代码:
  1. #include <speex.h>
  2. #include <stdio.h>
  3. /*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
  4. #define FRAME_SIZE 160
  5. int main(int argc, char **argv)
  6. {
    1. char *inFile;
    2. FILE *fin;
    3. short in[FRAME_SIZE];
    4. float input[FRAME_SIZE];
    5. char cbits[200];
    6. int nbBytes;
    7. /*保存编码的状态*/
    8. void *state;
    9. /*保存字节因此他们可以被speex常规读写*/
    10. SpeexBits bits;
    11. int i, tmp;
    12. //新建一个新的编码状态在窄宽(narrowband)模式下
    13. state = speex_encoder_init(&speex_nb_mode);
    14. //设置质量为8(15kbps)
    15. tmp=8;
    16. speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
    17. inFile = argv[1];
    18. fin = fopen(inFile, "r");
    19. //初始化结构使他们保存数据
    20. speex_bits_init(&bits);
    21. while (1)
    22. {
      1. //读入一帧16bits的声音
      2. fread(in, sizeof(short), FRAME_SIZE, fin);
      3. if (feof(fin))
        1. break;
      4. //把16bits的值转化为float,以便speex库可以在上面工作
      5. for (i=0;i<FRAME_SIZE;i++)
        1. input[i]=in[i];
      6. //清空这个结构体里所有的字节,以便我们可以编码一个新的帧
      7. speex_bits_reset(&bits);
      8. //对帧进行编码
      9. speex_encode(state, input, &bits);
      10. //把bits拷贝到一个利用写出的char型数组
      11. nbBytes = speex_bits_write(&bits, cbits, 200);
      12. //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
      13. fwrite(&nbBytes, sizeof(int), 1, stdout);
      14. //写出压缩后的数组
      15. fwrite(cbits, 1, nbBytes, stdout);
    23. }
    24. //释放编码器状态量
    25. speex_encoder_destroy(state);
    26. //释放bit_packing结构
    27. speex_bits_destroy(&bits);
    28. fclose(fin);
    29. return 0;
  7. }

speex的基本编码和解码流程的更多相关文章

  1. FFMPEG解码流程

    FFMPEG解码流程:  1. 注册所有容器格式和CODEC: av_register_all()  2. 打开文件: av_open_input_file()  3. 从文件中提取流信息: av_f ...

  2. (转)FFMPEG解码流程

    http://www.douban.com/note/228831821/ FFMPEG解码流程:     1. 注册所有容器格式和CODEC: av_register_all()     2. 打开 ...

  3. ffmpeg架构和解码流程分析

    转 一,ffmpeg架构 1. 简介 FFmpeg是一个集录制.转换.音/视频编码解码功能为一体的完整的开源解决方案.FFmpeg的 开发是基于Linux操作系统,但是可以在大多数操作系统中编译和使用 ...

  4. 最新FFMPEG解码流程

    FFMPEG解码流程: 1. 注册所有容器格式和CODEC:  av_register_all() 2. 打开文件:                    av_open_input_file() 3 ...

  5. NET MVC全局异常处理(一) 【转载】网站遭遇DDoS攻击怎么办 使用 HttpRequester 更方便的发起 HTTP 请求 C#文件流。 Url的Base64编码以及解码 C#计算字符串长度,汉字算两个字符 2019周笔记(2.18-2.23) Mysql语句中当前时间不能直接使用C#中的Date.Now传输 Mysql中Count函数的正确使用

    NET MVC全局异常处理(一)   目录 .NET MVC全局异常处理 IIS配置 静态错误页配置 .NET错误页配置 程序设置 全局异常配置 .NET MVC全局异常处理 一直知道有.NET有相关 ...

  6. 说说http协议中的编码和解码

    http://www.csdn1 2 3.com/html/itweb/20130730/29422_29378_29408.htm ****************************** 一. ...

  7. Web开发之编码与解码、签名、加密与解密

    在Web开发中,编码与解码.签名.加密与解密是非常常见的问题.本文不会介绍具体实例,而是介绍这些的原理.用途与区别.一.编码与解码        在Web开发中,需要通过URL的query参数来传递数 ...

  8. Java中的字节,字符与编码,解码

    ASCII编码 ASCII码主要是为了表示英文字符而设计的,ASCII码一共规定了128个字符的编码(0x00-0x7F),只占用了一个字节的后面7位,最前面的1位统一规定为0. ISO-8859-1 ...

  9. Base64编码与解码原理

    Base64编码是使用64个可打印ASCII字符(A-Z.a-z.0-9.+./)将任意字节序列数据编码成ASCII字符串,另有“=”符号用作后缀用途. base64索引表 base64编码与解码的基 ...

随机推荐

  1. 使用Application_Error捕获站点错误并写日志

    Global.ascx页面使用以下方法即可捕获应用层没有try cath的错误 protected void Application_Error(Object sender, EventArgs e) ...

  2. MySQL数据库my.cnf配置文件注释详解

    我们知道,在MySQL数据库安装完成后,要对my.cnf配置文件进行适当的修改才能充分利用MySQL数据库的功能.但是对于初学者来说,修改my.cnf配置文件似乎是一个比较难的过程.为了解决这个问题, ...

  3. 静默安装ORACLE【weber出品必属精品】

    安装配置系统环境安装linux ,所有服务都不选择,只是选择安装开发工具,不要安装防火墙(当然也可以在后面关闭) 打开终端,执行如下命令,检查安装包,没有的都要安装 make, glibc, liba ...

  4. iOS SearchBar为什么跳不出来第三方输入法

    去掉键盘类型就好了 // lineSearchBar.keyboardType = UIKeyboardTypeNamePhonePad;

  5. Oracle数据库简介

    Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...

  6. 微信 回复多图文 借助php框架

    private function replyMostPhoto($data,$arr){$this->logger("已经到达回复多图文!".$arr[0]['Title'] ...

  7. php 被抛弃使用的函数

    call_user_method()(使用 call_user_func() 替代)     call_user_method_array() (使用 call_user_func_array() 替 ...

  8. c++ string类型转换为char *类型

    string 是c++标准库里面其中一个,封装了对字符串的操作 把string转换为char* 有3中方法: 1.data 如: string str="abc"; char *p ...

  9. 总结:man, info, hwclock, cal, type, which, dirname, basename, who, which, whatis, makewhatis, hash, tty

    man, info, help, date, hwclock, cal, shutdown, reboot, halt, poweroff, type, cd, which, dirname, bas ...

  10. DP #1 Singleton Pattern线程安全问题

    单例模式确保一个类只有一个实例,自行提供这个实例并向整个系统提供这个实例. 其中涉及到最主要的问题就是在多线程并发时线程安全问题. 单例模式的实现也有一个循序渐进的过程:1.最基本要求:每次从getI ...