(1) pcm格式
   pcm是经过话筒录音后直接得到的未经压缩的数据流
   数据大小=采样频率*采样位数*声道*秒数/8
    采样频率一般是22k或者44k,位数一般是8位或者16位,声道一般是单声道或者双声道
    pcm属于编码格式,就是一串由多个样本值组成的数据流, 本身没有任何头信息或者帧的概念,。如果不是音频的录制者,光凭一段PCM数据,是没有办法知道它的采样率等信息的。(网上有说法指2048个采样算一帧PCM,http://www.360doc.com/content/11/1230/19/2226925_176139396.shtml,不知道这种说法是否正确)
 
   参见:
 
 (2)WAV格式
   WAV格式是封装格式,里面本身可以存放多种编码格式的数据,不过一般都是存放的PCM数据,存放其他编码意义不是很大。
   wav文件由wav文件头部分和wav文件数据体部分组成,0-43字节存放采样率、通道数、数据部分的标识符等头信息,44字节以后的就是数据部分。 很显然,wav的头信息很重要,一旦头信息损坏了,播放估计会有问题。
   参见:
  WAV格式  
 
 (3)MP3格式
   MP3是封装格式,里面存放的数据使用的编码方式称为MPEG1 Layer-3 
   MP3文件由TAG_V2(ID3V2)结构体,一组Frame, TAG_V1(ID3V1)结构体组成,头部的TAG结构体不一定存在,需要进行判断,尾部的TAG长度为128个字节,也需要进行判断。
   中间的一组Frame,Frame长度可以定长也可以边长,每一个Frame都由帧头和数据实体组成,帧头记录了mp3的位率,采样率,版本等信息,每个帧之间相互独立,各帧相互独立。也就是说即使前面的帧损坏了,后面的也是可以播放的。
    参见:
    Mp3帧分析(数据帧)  
    MP3 File Structure   
 
  (4)AMR格式
    AMR文件包含一个文件头,后面就是一帧一帧的AMR帧。文件头里面的值是固定值,用于标识该文件为AMR文件。每个帧分为帧头和数据部分,帧头里面包含编码方式以及辅助信息。AMR的采样率根据编码方式不同而不同,因此不像MP3一样,在每个帧里面存放采样率。
  参见:
  AMR format  
 
(5)AAC格式
   初步了解,AAC文件可以没有文件头,全部由帧序列组成,每个帧由帧头和数据部分组成。帧头包含采样率、声道数、帧长度等,有点类似MP3格式。
   关于AAC格式的文章网上非常少,只看到以下几篇:
   AAC 格式分析     
 
  (6)CAF文件
   CAF是苹果的一种音频封装格式,与WAV差不多,里面可以存放LPCM、MP3等多种编码数据。
   参见:
 
---------------------------------------------------------------------------------------- 

本人博客内容系个人学习与研究的笔记,如存在谬误或缺失,请见谅并指出,谢谢。
  本文地址:http://www.cnblogs.com/gugupluto/p/3584320.html

转载请注明来自:http://www.cnblogs.com/gugupluto/

----------------------------------------------------------------------------------------

 

iOS音频学习笔记一:常见音频封装格式及编码格式的更多相关文章

  1. iOS音频学习笔记三:音频会话管理

    ​      使用Audio Session API ,可以指定App需要的音频行为,比如,当播放音频时,使得其他应用App静音或者混和在一起,也可以指定当App的音频被中断(例如被电话)时的行为,还 ...

  2. Spring MVC 学习笔记11 —— 后端返回json格式数据

    Spring MVC 学习笔记11 -- 后端返回json格式数据 我们常常听说json数据,首先,什么是json数据,总结起来,有以下几点: 1. JSON的全称是"JavaScript ...

  3. iOS音频学习笔记二:iOS SDK中与音频有关的相关框架

      上层:       Media Player Framework: 包含MPMoviePlayerController.MPMoviePlayerViewController.MPMusicPla ...

  4. Android应用开发学习笔记之播放音频

    作者:刘昊昱 博客:http://blog.csdn.net/liuhaoyutz Android支持常用音视频格式文件的播放,本文我们来学习怎样开发Android应用程序对音视频进行操作. Andr ...

  5. cips2016+学习笔记︱简述常见的语言表示模型(词嵌入、句表示、篇章表示)

    在cips2016出来之前,笔者也总结过种类繁多,类似词向量的内容,自然语言处理︱简述四大类文本分析中的"词向量"(文本词特征提取)事实证明,笔者当时所写的基本跟CIPS2016一 ...

  6. XML学习笔记(二)-- DTD格式规范

    标签(空格分隔): 学习笔记 XML的一个主要目的是允许应用程序之间自由交换结构化的数据,因此要求XML文档具有一致的结构.业务逻辑和规则.可以定义一种模式来定义XML文档的结构,并借此验证XML文档 ...

  7. JMeter学习笔记16-如何输出HTML格式的性能测试报告

    文本来学习下,如何输入HTML格式的JMeter测试报告.前面已经介绍, 如果要做性能测试,需要在GUI上设计好你的Test Plan,设置各种场景和负载值,包括多少个线程,多少个用户,循环多少次.设 ...

  8. FFmpeg编程学习笔记二:音频重採样

    ffmpeg实现音频重採样的核心函数swr_convert功能很强大,但是ffmpeg文档对它的凝视太过简单.在应用中往往会出这样那样的问题,事实上在读取数据->重採样->编码数据的循环中 ...

  9. ios开发学习笔记(1)

    objective-c基础总结 第一二章 1.application:didiFinishLauchingWithOptions:程序启动后立即执行 2.启动界面代码格式:self.window = ...

随机推荐

  1. django 中单独执行py文件修改用户名

    Python文件代码 import os import django # 在environ字典里设置默认Django环境,'xxxx.settings'指Django项目的配置文件 os.enviro ...

  2. pytorch中调整学习率的lr_scheduler机制

    有的时候需要我们通过一定机制来调整学习率,这个时候可以借助于torch.optim.lr_scheduler类来进行调整:一般地有下面两种调整策略:(通过两个例子来展示一下) 两种机制:LambdaL ...

  3. Python3 IO编程之操作文件和目录

    如果我们要操作文件,目录,可以在命令行下面输入操作系统提供的各种命令来完成.比如ls,cp等命令 如果要在python程序中执行这些目录和文件的操作怎么办?其实操作系统提供的命令指示简单地调用了操作系 ...

  4. 06点睛Spring MVC 4.1-文件上传

    6.1 文件上传 在控制器参数使用@RequestParam("file") MultipartFile file接受单个文件上传; 在控制器参数使用@RequestParam(& ...

  5. k8s调度器之亲和性和反亲和性/节点选择器

    容器在节点(物理机)上是如何部署的 是由调度器scheduler进行调度的 调度策略 随机 通过节点选择器选择某些节点 通过节点亲和性和pod的亲和性及反亲和性实现更细粒度的控制 参考 https:/ ...

  6. idea安装svn

    idea不像eclipse那样是用插件,idea是直接指向已经安装好的svn.exe.

  7. PHP 数据库连接

    $db = new MySQLi("localhost","root","123","php0307"); !mysql ...

  8. Linux 脚本语言入门

    0.脚本编写初步介绍 (1)脚本第一行以 #!/bin/sh 开始,也可以用 #!/bin/bash 开始,但是第一行必须以这种方式开始. (2)脚本名需要以.sh结尾 (3)#开头的句子表示注释 ( ...

  9. QPS、TPS和系统吞吐量

    QPS:Queries Per Second,每秒查询率.是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准. TPS:Transactions Per ...

  10. springboot使用neo4j

    springboot2.2使用neo4j第一次更新先放一些代码进来,下次加注释1.引入相应的包<dependency> <groupId>org.springframework ...