【雷神源码解析】无基础看懂AAC码流解析，看不懂你打我

一前言

　　最近在尝试学习一些视频相关的知识，随便一搜才知道原来国内有雷神这么一个真正神级的人物存在，尤其是在这里（传送门）看到他的感言更是对他膜拜不已，雷神这种无私奉献的精神应当被我辈发扬光大。那写这篇随笔的理由是在看他写的AAC音频码流解析文章时（传送门）遇到一些问题，因为雷神毕竟等级与初学者不同，一些在他看来很基础的东西菜鸟（比如我）一看就懵逼了，看得是云里雾里，而且我在评论中也看到有人提问相同的问题，但是并没有人给出解答，我自己花了将近三个小时仔细看了AAC码流的介绍才明白，这里也献丑讲解一下。

二 AAC码流数据存储格式

　　这里先把雷神的话看一遍

这当然是没问题的，不过雷神说的有点过于简单了，ADTS frame内部的结构的什么样子的？数据存储在ADTS frame的哪一部分？这些并没有说清楚，所以下面看代码时就会搞不懂。我通过AAC Audio ES Viewer打开了一个AAC码流文件，这个软件能将一个AAC码流文件解析成一个个的ADTS frame，咱们来看一下（图片较大，如果看不清可以在新窗口打开查看）

我这里选择了第一个ADTS段，看右边的部分，可以看到一个ADTS内部其实又有四个部分组成：adts_fixed_header/adts_variable_header/adts_error_check/raw_data_block，其中后两个部分中并没有什么东西，咱们就先不管它们，重点分析下前两个部分。上面图中每一个部分后面都标了所占的bit，咱们可以计算一下，可以知道总共是56bit，也就是7个byte。也就是说ADTS header占7个字节，header也有可能占9个字节，看adts_fixed_header部分中的protection_absent，当这个值为0时，占7字节，为1时会占9个字节，当然这个就先说到这里，不是今天的重点，先不讨论。接下来咱们说下前面两个部分中比较重要的参数含义：

adts_fixed_header

　　syncword：同步字，占12bit，值固定，都是0xFFF，转成二进制就是111111111111，这是每个ADTS frame的开头，就像上面雷神说的，咱们可以找到这个值，就能把AAC码流一个一个的分割开
　　ID：表示使用的MPEG的版本，0表示MPEG-4，1表示MPEG-2
　　layer：同syncword，值固定，都是00
　　protection_absent：是否有同步校验，如果有值是0，没有是1
　　profile：使用的AAC级别
　　sampling_frequency_index：采样率，上图中可以看到是48000 Hz
　　channel_configuration：声道数，上图中可以看到两个声道，LF RF表示左右声道

adts_variable_header

aac_frame_length:ADTS frame长度，包括header和data部分（这个很关键）

好了，上面就是比较重要的参数介绍，知道这些，有助于理解雷神的代码思路。

三代码解析

先把雷神的代码抄过来

 int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){

     int size = ;

     if(!buffer || !data || !data_size ){

         return -;

     }

     while(){

         if(buf_size  <  ){

             return -;

         }

         //Sync words

         if((buffer[] == 0xff) && ((buffer[] & 0xf0) == 0xf0) ){

             size |= ((buffer[] & 0x03) <<);     //high 2 bit

             size |= buffer[]<<;                //middle 8 bit

             size |= ((buffer[] & 0xe0)>>);        //low 3bit

             break;

         }

         --buf_size;

         ++buffer;

     }

     if(buf_size < size){

         return ;

     }

     memcpy(data, buffer, size);

     *data_size = size;

     return ;

 }

 int simplest_aac_parser(char *url)

 {

     int data_size = ;

     int size = ;

     int cnt=;

     int offset=;

     //FILE *myout=fopen("output_log.txt","wb+");

     FILE *myout=stdout;

     unsigned char *aacframe=(unsigned char *)malloc(*);

     unsigned char *aacbuffer=(unsigned char *)malloc(*);

     FILE *ifile = fopen(url, "rb");

     if(!ifile){

         printf("Open file error");

         return -;

     }

     printf("-----+- ADTS Frame Table -+------+\n");

     printf(" NUM | Profile | Frequency| Size |\n");

     printf("-----+---------+----------+------+\n");

     while(!feof(ifile)){

         data_size = fread(aacbuffer+offset, , *-offset, ifile);

         unsigned char* input_data = aacbuffer;

         while()

         {

             int ret=getADTSframe(input_data, data_size, aacframe, &size);

             if(ret==-){

                 break;

             }else if(ret==){

                 memcpy(aacbuffer,input_data,data_size);

                 offset=data_size;

                 break;

             }

             char profile_str[]={};

             char frequence_str[]={};

             unsigned char profile=aacframe[]&0xC0;

             profile=profile>>;

             switch(profile){

             case : sprintf(profile_str,"Main");break;

             case : sprintf(profile_str,"LC");break;

             case : sprintf(profile_str,"SSR");break;

             default:sprintf(profile_str,"unknown");break;

             }

             unsigned char sampling_frequency_index=aacframe[]&0x3C;

             sampling_frequency_index=sampling_frequency_index>>;

             switch(sampling_frequency_index){

             case : sprintf(frequence_str,"96000Hz");break;

             case : sprintf(frequence_str,"88200Hz");break;

             case : sprintf(frequence_str,"64000Hz");break;

             case : sprintf(frequence_str,"48000Hz");break;

             case : sprintf(frequence_str,"44100Hz");break;

             case : sprintf(frequence_str,"32000Hz");break;

             case : sprintf(frequence_str,"24000Hz");break;

             case : sprintf(frequence_str,"22050Hz");break;

             case : sprintf(frequence_str,"16000Hz");break;

             case : sprintf(frequence_str,"12000Hz");break;

             case : sprintf(frequence_str,"11025Hz");break;

             case : sprintf(frequence_str,"8000Hz");break;

             default:sprintf(frequence_str,"unknown");break;

             }

             fprintf(myout,"%5d| %8s|  %8s| %5d|\n",cnt,profile_str ,frequence_str,size);

             data_size -= size;

             input_data += size;

             cnt++;

         }   

     }

     fclose(ifile);

     free(aacbuffer);

     free(aacframe);

     return ;

 }

然后说一下当初我看的时候迷惑的地方。

1、代码第9行，为什么要判断size是否小于7？

答：第二部分时有说，一个ADTS header最少占7字节，当小于7字节时，说明不是一个ADTS frame或数据不完整，没必要解析了。

2、第13行，((buffer[1] & 0xf0) == 0xf0)，为什么要进行位运算？

答：第二部分也有说，同步字占12bit，也就是它占了1.5个字节，第一个字节和第二个字节的前四位，0xF0用二进制表示是11110000，和buffer[1]进行&运算后如果还是11110000，说明第二个字节的前四位是1111，再加上前面的buffer[0]=0xFF，就可以判定buffer的前12bit是111111111111，也就取得了syncword。

3、取size的三行代码到底是什么鬼？？？？

size |= ((buffer[] & 0x03) <<);     //high 2 bit

size |= buffer[]<<;                //middle 8 bit

size |= ((buffer[] & 0xe0)>>);        //low 3bit

其实雷神注释中已经说了，但是不了解数据结构的依然会懵逼。第二部分说了，ADTS header中有ADTS frame的大小，但是根据上面同步字咱们可以看出来，这些数据并不是以字节为单位连续排列的，而是按位排列的，这就有点纠结了不是？那size存储在哪一位中，从哪里开始？在哪里结束？头大！！别急，我画了一张图（图片比较大，如果看不情，可以在新窗口中查看，或点这里下载）

从这一张图中可以很清晰的看到，frame_length存储在第4个字节的后两位，第5个字节，第6个字节的前三位。好了，知道这些再看上面的三行代码，不难理解了吧，如果还理解不了，说明得补充一下编程知识啦。

4、74和83行什么意思？

答：这两行代码分别是求取profile和sampling_frequency_index值的，理解了上面的第2和第3个问题，这个问题也就不是问题啦。

四结言

以上是我学习时的问题，由于我在视频方面是纯新手，所以我的问题应该大部分人都会有，上面四个问题理解了后，整体代码对你就没有秘密而言了。我不希望别人也像我一样花几个小时搞明白，太浪费时间了。

参考资料：AAC的ADTS头文件信息介绍

【雷神源码解析】无基础看懂AAC码流解析，看不懂你打我的更多相关文章

关于c语言的位运算&，|，^（看懂汉字的都能看懂）
其中|,&可以当作逻辑运算符,当|,&当成逻辑运算符时,与||,&&的用法基本相似,&&,||运算时会当前面的表达式能够决定整个表达式,则不进行对后面的 ...
追源索骥：透过源码看懂Flink核心框架的执行流程
li,ol.inline>li{display:inline-block;padding-right:5px;padding-left:5px}dl{margin-bottom:20px}dt, ...
dubbo面试题,会这些说明你真正看懂了dubbo源码
整理了一些dubbo可能会被面试的面试题,感觉非常不错.如果你基本能回答说明你看懂了dubbo源码,对dubbo了解的足够全面.你可以尝试看能不能回答下.我们一起看下有哪些问题吧? 1.dubbo中& ...
从源码带你看懂functools的partial方法
1.what? partial是什么, partial也叫偏函数.源码的描述是: 部分应用给定参数和关键字的新函数. New function with partial application of ...
把nc v6的源码看懂
看懂nc v6的源码! 碧桂园全部的正式环境的补丁都在我手里. 2015-11-18 2:33 谢谢两位一起努力的兄弟谢谢超哥,谢谢祈冰哥,谢谢连老师,陈明大哥,谢谢龙哥,珍玉,谢谢廖生哥,谢谢林春 ...
（原创）超详细一步一步在eclipse中配置Struts2环境，无基础也能看懂
(原创)超详细一步一步在eclipse中配置Struts2环境,无基础也能看懂 1. 在官网https://struts.apache.org下载Struts2,建议下载2.3系列版本.从图中可以看出 ...
Nginx源码分析：3张图看懂启动及进程工作原理
编者按:高可用架构分享及传播在架构领域具有典型意义的文章,本文由陈科在高可用架构群分享.转载请注明来自高可用架构公众号「ArchNotes」. 导读:很多工程师及架构师都希望了解及掌握高性能服务器 ...
小白都能看懂的 Spring 源码揭秘之Spring MVC
目录前言 Spring MVC 请求流程 Spring MVC 两大阶段初始化 HttpServletBean#init() FrameworkServlet#initServletBean Fr ...
透过源码看懂Flink核心框架的执行流程
前言 Flink是大数据处理领域最近很火的一个开源的分布式.高性能的流式处理框架,其对数据的处理可以达到毫秒级别.本文以一个来自官网的WordCount例子为引,全面阐述flink的核心架构及执行流程 ...

随机推荐

shell知识
shell基本的语句一:if语句格式: if [ #条件的判断 ];then #执行的动作 fi 操作符 + 加 - 减 * 乘 / 除[取整数商] % 余[取余数] 数值的比较参数说明 ...
Codeforces Round #538 (Div. 2) CTrailing Loves (or L'oeufs?)
这题明白的意思就是求n!在b进制下的后缀零的个数. 即最大的n!%(b^k)==0的k的值.我们需要将如果要构成b这个数,肯定是由一个个质因子相乘得到的.我们只需要求出b的质因子,然后分析n!中可以组 ...
从文件中读取数组数据————Java
自己总结一下Java文件的读取类似数组数据的方法,自己可以快速查看. 一.规整化数据: 对于数组数据是一一对应的情况 ArrayList<String> arrayList = new A ...
django中views中方法的request参数
知其然亦要知其所以然 views每个方法的参数都是request,那么问题来了,request为何物? 首先,几乎每个方法都是取数据(无论是从数据库,还是从第三方接口),然后进行一定的处理,之后传给前 ...
83、源代码管理工具(Git)
一.简介 git是一款开源的分布式版本控制工具在世界上所有的分布式版本控制工具中,git是最快.最简单.最流行的 git起源作者是Linux之父:Linus Benedict Torvalds 当 ...
使用mobx项目开发总结（不再更新）
mobx的优点 1,使用@observer的组件真正实现按需更新,只有监听的数据发生变化,它才会re-render,尽管父组件发生更新,但是子组件只要有@observer,则不会触发更新,类似于实 ...
lwip协议栈移植（1）
lwip移植分为两类: 1,只移植内核核心,用户应用程序编写只能基于raw/callback api进行 2,移植内核核心和上层API函数模块,用户可以使用所有三种API编程,即 raw/callba ...
1021. Deepest Root DFS 求最长无环路径
第一次出现超时 ac不了的题思路一:对于每个节点用一次dfs dfs中记录到当前的最长路径,若大于最长,则清除set,并加入当前节点思路二:先查找只有一个相邻节点的节点进行dfs,由于可能存在闭 ...
配置wildfly10为linux的服务，并开机启动
1.在opt路径下下载 wildfly ,并解压下载下的压缩包 cd /opt sudo wget -c http://download.jboss.org/wildfly/10.0.0.Final ...
c++中二级指针的使用场景
二级指针的使用场景如下: 1.主要用来为指针变量分配内存空间: void GetMemory(char **p) { *p = ]; } 函数调用方式: char *str = NULL; GetMe ...

【雷神源码解析】无基础看懂AAC码流解析，看不懂你打我

【雷神源码解析】无基础看懂AAC码流解析，看不懂你打我的更多相关文章

随机推荐

热门专题