(1) pcm格式
   pcm是经过话筒录音后直接得到的未经压缩的数据流
   数据大小=采样频率*采样位数*声道*秒数/8
    采样频率一般是22k或者44k,位数一般是8位或者16位,声道一般是单声道或者双声道
    pcm属于编码格式,就是一串由多个样本值组成的数据流, 本身没有任何头信息或者帧的概念,。如果不是音频的录制者,光凭一段PCM数据,是没有办法知道它的采样率等信息的。(网上有说法指2048个采样算一帧PCM,http://www.360doc.com/content/11/1230/19/2226925_176139396.shtml,不知道这种说法是否正确)
 
   参见:
 
 (2)WAV格式
   WAV格式是封装格式,里面本身可以存放多种编码格式的数据,不过一般都是存放的PCM数据,存放其他编码意义不是很大。
   wav文件由wav文件头部分和wav文件数据体部分组成,0-43字节存放采样率、通道数、数据部分的标识符等头信息,44字节以后的就是数据部分。 很显然,wav的头信息很重要,一旦头信息损坏了,播放估计会有问题。
   参见:
  WAV格式  
 
 (3)MP3格式
   MP3是封装格式,里面存放的数据使用的编码方式称为MPEG1 Layer-3 
   MP3文件由TAG_V2(ID3V2)结构体,一组Frame, TAG_V1(ID3V1)结构体组成,头部的TAG结构体不一定存在,需要进行判断,尾部的TAG长度为128个字节,也需要进行判断。
   中间的一组Frame,Frame长度可以定长也可以边长,每一个Frame都由帧头和数据实体组成,帧头记录了mp3的位率,采样率,版本等信息,每个帧之间相互独立,各帧相互独立。也就是说即使前面的帧损坏了,后面的也是可以播放的。
    参见:
    Mp3帧分析(数据帧)  
    MP3 File Structure   
 
  (4)AMR格式
    AMR文件包含一个文件头,后面就是一帧一帧的AMR帧。文件头里面的值是固定值,用于标识该文件为AMR文件。每个帧分为帧头和数据部分,帧头里面包含编码方式以及辅助信息。AMR的采样率根据编码方式不同而不同,因此不像MP3一样,在每个帧里面存放采样率。
  参见:
  AMR format  
 
(5)AAC格式
   初步了解,AAC文件可以没有文件头,全部由帧序列组成,每个帧由帧头和数据部分组成。帧头包含采样率、声道数、帧长度等,有点类似MP3格式。
   关于AAC格式的文章网上非常少,只看到以下几篇:
   AAC 格式分析     
 
  (6)CAF文件
   CAF是苹果的一种音频封装格式,与WAV差不多,里面可以存放LPCM、MP3等多种编码数据。
   参见:
 
---------------------------------------------------------------------------------------- 

本人博客内容系个人学习与研究的笔记,如存在谬误或缺失,请见谅并指出,谢谢。
  本文地址:http://www.cnblogs.com/gugupluto/p/3584320.html

转载请注明来自:http://www.cnblogs.com/gugupluto/

----------------------------------------------------------------------------------------

 

iOS音频学习笔记一:常见音频封装格式及编码格式的更多相关文章

  1. iOS音频学习笔记三:音频会话管理

    ​      使用Audio Session API ,可以指定App需要的音频行为,比如,当播放音频时,使得其他应用App静音或者混和在一起,也可以指定当App的音频被中断(例如被电话)时的行为,还 ...

  2. Spring MVC 学习笔记11 —— 后端返回json格式数据

    Spring MVC 学习笔记11 -- 后端返回json格式数据 我们常常听说json数据,首先,什么是json数据,总结起来,有以下几点: 1. JSON的全称是"JavaScript ...

  3. iOS音频学习笔记二:iOS SDK中与音频有关的相关框架

      上层:       Media Player Framework: 包含MPMoviePlayerController.MPMoviePlayerViewController.MPMusicPla ...

  4. Android应用开发学习笔记之播放音频

    作者:刘昊昱 博客:http://blog.csdn.net/liuhaoyutz Android支持常用音视频格式文件的播放,本文我们来学习怎样开发Android应用程序对音视频进行操作. Andr ...

  5. cips2016+学习笔记︱简述常见的语言表示模型(词嵌入、句表示、篇章表示)

    在cips2016出来之前,笔者也总结过种类繁多,类似词向量的内容,自然语言处理︱简述四大类文本分析中的"词向量"(文本词特征提取)事实证明,笔者当时所写的基本跟CIPS2016一 ...

  6. XML学习笔记(二)-- DTD格式规范

    标签(空格分隔): 学习笔记 XML的一个主要目的是允许应用程序之间自由交换结构化的数据,因此要求XML文档具有一致的结构.业务逻辑和规则.可以定义一种模式来定义XML文档的结构,并借此验证XML文档 ...

  7. JMeter学习笔记16-如何输出HTML格式的性能测试报告

    文本来学习下,如何输入HTML格式的JMeter测试报告.前面已经介绍, 如果要做性能测试,需要在GUI上设计好你的Test Plan,设置各种场景和负载值,包括多少个线程,多少个用户,循环多少次.设 ...

  8. FFmpeg编程学习笔记二:音频重採样

    ffmpeg实现音频重採样的核心函数swr_convert功能很强大,但是ffmpeg文档对它的凝视太过简单.在应用中往往会出这样那样的问题,事实上在读取数据->重採样->编码数据的循环中 ...

  9. ios开发学习笔记(1)

    objective-c基础总结 第一二章 1.application:didiFinishLauchingWithOptions:程序启动后立即执行 2.启动界面代码格式:self.window = ...

随机推荐

  1. JSOUP 爬虫

    作者QQ:1095737364    QQ群:123300273     欢迎加入! 1.mavne 依赖: <!--html 解析 : jsoup HTML parser library @ ...

  2. 算法习题---5.9数据库(Uva1592)

    一:题目 对数据库中数据进行检测,是否出现数据冗余现象.即是否某一列出现两个及以上数据重复 如上图中,第二列中第2,3行数据重复,所以我们判断为数据冗余.因为他可以分解为下面两张表 (一)样例输入 H ...

  3. [译]如何在GitHub仓库创建一个标签tag, 并推送到远程分支?

    问: 我在GitHub上有一个仓库,我需要给他打个tag.我在shell打了tag,但是在Github上没有显示出来.我还要做其他什么么? 我在shell中使用的命令是: git tag 2.0 当我 ...

  4. 转 mysql 存储过程初探

    https://www.cnblogs.com/qmfsun/p/4838032.htmlMySQL命令执行sql文件的两种方法 https://www.cnblogs.com/mark-chan/p ...

  5. Django models中的meta选项

    通过一个内嵌类 "class Meta" 给你的 model 定义元数据, 类似下面这样: class Foo(models.Model): bar = models.CharFi ...

  6. css 颜色混合模式 mix-blend-mode

    CSS3 新增了一个很有意思的属性 -- mix-blend-mode ,其中 mix 和 blend 的中文意译均为混合,那么这个属性的作用直译过来就是混合混合模式,当然,我们我们通常称之为混合模式 ...

  7. Socket测试工具(客户端、服务端)

    Socket是什么? SOCKET用于在两个基于TCP/IP协议的应用程序之间相互通信.最早出现在UNIX系统中,是UNIX系统主要的信息传递方式.在WINDOWS系统中,SOCKET称为WINSOC ...

  8. 常见问题:MySQL/B+树

    平衡二叉树 此前讲红黑树时也提到了平衡二叉树,红黑树和AVL树都是能保证树不退化的平衡二叉树,平衡二叉树采用二分思想组织数据,能大大提高单点查找数据的效率,其组装过程略. 作为对比,此处也列出平衡二叉 ...

  9. win10中禁用Ctrl+Alt+上下左右箭头的方法

    win10的Ctrl+Alt+向左/右/上/下箭头,与pycharm中的快捷键有冲突,需要禁用 右键''显示设置''---->高级显示设置------->显示器1的显示适配属性-----& ...

  10. Keras.NET

    [翻译]Keras.NET简介 - 高级神经网络API in C#   Keras.NET是一个高级神经网络API,它使用C#编写,并带有Python绑定,可以在Tensorflow.CNTK或The ...