【视频编解码·学习笔记】4. H.264的码流封装格式 & 提取NAL有效数据
一、码流封装格式简单介绍:
H.264的语法元素进行编码后,生成的输出数据都封装为NAL Unit进行传递,多个NAL Unit的数据组合在一起形成总的输出码流。对于不同的应用场景,NAL规定了一种通用的格式适应不同的传输封装类型。
通常NAL Unit的传输格式分两大类:字节流格式和RTP包格式
字节流格式:
- 大部分编码器的默认输出格式
- 每个NAL Unit以规定格式的起始码分割
- 起始码:0x 00 00 00 01 或 0x 00 00 01
RTP数据包格式:
- NAL Unit按照RTP数据包的格式封装
- 使用RTP包格式不需要额外的分割识别码,在RTP包的封装信息中有相应的数据长度信息。
- 可以在NAL Unit的起始位置用一个固定长度的长度码表示整个NAL Unit的长度
实际应用中字节流格式更为常用,下面的均以字节流格式来介绍。
通过查阅H.264官方说明文档,了解NAL字节流格式(在附录B)
![]()
有用数据前面会加 0x 00 00 00 01 或 0x 00 00 01,作为起始码,两个起始码中间包含的即为有用数据流
如: 00 00 00 01 43 23 56 78 32 1A 59 2D 78 00 00 00 01 C3 E2 …… 中,红色的部分即为有效数据。
本次使用上一篇笔记中生成的test.264作为例子。
使用Ultra Edit打开此文件,可以看到该文件的数据流:
![]()
接下来将写一个小程序,从二进制码流文件中截取实际的NAL数据。
二、C++程序 从码流中提取NAL有效数据:
新建一个VS工程,配置工程属性。将【常规-输出目录】和【调试-工作目录】改为$(SolutionDir)bin\$(Configuration)\,【调试-命令参数】改为test.264编译、运行程序。
![]()
在 bin\debug 目录下可看到生成的exe执行文件
接下来编写程序的功能:
提取起始码之间的有效数据
程序思路:
从码流中寻找 00 00 00 01 或 00 00 01序列,后面就是有效数据流,将之后的数据保存起来,直到遇到下一个(00) 00 00 01 停止。
下面开始编写程序:
① 打开码流文件
使用下面的代码测试,比较简单,不再解释,最后记得要把文件流关掉。
int _tmain(int argc, _TCHAR* argv[])
{
FILE *pFile_in = NULL;
// 打开刚才导入的二进制码流文件
_tfopen_s(&pFile_in, argv[1], _T("rb"));
// 判断文件是否打开成功
if (!pFile_in)
{
printf("Error: Open File failed. \n");
}
fclose(pFile_in);
return 0;
}
② 寻找起始码
- 使用数据类型
unsigned char数据类型来存储单个字节码 - 为了减少内存使用,使用数组 refix3,存储连续的三个字节码
- 数组循环使用,新进来的数据放在弹出那位数据的位置上
- 即:数组的存数顺序为 [0][1][2],下一个字符放在[0]的位置上,此时数据顺序为[1][2][0],再下一次[2][0][1]以此类推
- 由于起始码有两种格式00 00 01 和 00 00 00 01,因此需要有两个判断分别对应
代码如下:
typedef unsigned char uint8;
static int find_nal_prefix(FILE **pFileIn)
{
FILE *pFile = *pFileIn;
// 00 00 00 01 x x x x x 00 00 00 01
// 以下方法为了减少内存,及向回移动文件指针的操作
uint8 prefix[3] = { 0 };
/*
依次比较 [0][1][2] = {0 0 0}; 若不是,将下一个字符放到[0]的位置 -> [1][2][0] = {0 0 0} ; 下次放到[1]的位置,以此类推
找到三个连0之后,还需判断下一个字符是否为1, getc() = 1 -> 00 00 00 01
以及判断 [0][1][2] = {0 0 1} -> [1][2][0] = {0 0 1} 等,若出现这种序列则表示找到文件头
*/
// 标记当前文件指针位置
int pos = 0;
// 标记查找的状态
int getPrefix = 0;
// 读取三个字节
for (int idx = 0; idx < 3; idx++)
{
prefix[idx] = getc(pFile);
}
while (!feof(pFile))
{
if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 1))
{
// 0x 00 00 01 found
getPrefix = 1;
break;
}
else if((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 0))
{
if (1 == getc(pFile))
{
// 0x 00 00 00 01 found
getPrefix = 2;
break;
}
}
else
{
fileByte = getc(pFile);
prefix[(pos++) % 3] = fileByte;
}
}
return getPrefix;
}
③ 提取有效数据
- 使用容器vector 存储有效数据
- 函数find_nal_prefix() 添加参数 vector &nalBytes
- 每次读取的数据都直接push到nalBytes中,若遇到起始码再把起始码pop掉
- 本函数需要重复执行,第一次文件指针移动到有效数据起始位置;第二次提取两段起始码间的有效数据;第三次在移动到下一个起始码后;第四次提取有效数据... 以此类推。
函数调整为:
static int find_nal_prefix(FILE **pFileIn, vector<uint8> &nalBytes)
{
FILE *pFile = *pFileIn;
// 00 00 00 01 x x x x x 00 00 00 01
// 以下方法为了减少内存,及向回移动文件指针的操作
uint8 prefix[3] = { 0 };
// 表示读进来字节的数值
uint8 fileByte;
/*
依次比较 [0][1][2] = {0 0 0}; 若不是,将下一个字符放到[0]的位置 -> [1][2][0] = {0 0 0} ; 下次放到[1]的位置,以此类推
找到三个连0之后,还需判断下一个字符是否为1, getc() = 1 -> 00 00 00 01
以及判断 [0][1][2] = {0 0 1} -> [1][2][0] = {0 0 1} 等,若出现这种序列则表示找到文件头
*/
nalBytes.clear();
// 标记当前文件指针位置
int pos = 0;
// 标记查找的状态
int getPrefix = 0;
// 读取三个字节
for (int idx = 0; idx < 3; idx++)
{
prefix[idx] = getc(pFile);
// 每次读进来的字节 都放入vector中
nalBytes.push_back(prefix[idx]);
}
while (!feof(pFile))
{
if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 1))
{
// 0x 00 00 01 found
getPrefix = 1;
// 这三个字符没用,pop掉
nalBytes.pop_back();
nalBytes.pop_back();
nalBytes.pop_back();
break;
}
else if((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 0))
{
if (1 == getc(pFile))
{
// 0x 00 00 00 01 found
getPrefix = 2;
// 这三个字符没用,pop掉 (最后那个1没填到vector中,不用pop)
nalBytes.pop_back();
nalBytes.pop_back();
nalBytes.pop_back();
break;
}
}
else
{
fileByte = getc(pFile);
prefix[(pos++) % 3] = fileByte;
nalBytes.push_back(fileByte);
}
}
return getPrefix;
}
主函数调整为:
#include "stdafx.h"
#include <stdio.h>
#include <vector>
typedef unsigned char uint8;
using namespace std;
int _tmain(int argc, _TCHAR* argv[])
{
FILE *pFile_in = NULL;
// 打开刚才导入的二进制码流文件
_tfopen_s(&pFile_in, argv[1], _T("rb"));
// 判断文件是否打开成功
if (!pFile_in)
{
printf("Error: Open File failed. \n");
}
vector<uint8> nalBytes;
find_nal_prefix(&pFile_in, nalBytes);
find_nal_prefix(&pFile_in, nalBytes);
for (int idx = 0; idx < nalBytes.size(); idx++)
{
printf("%x ", nalBytes.at(idx));
}
printf("\n");
find_nal_prefix(&pFile_in, nalBytes);
for (int idx = 0; idx < nalBytes.size(); idx++)
{
printf("%x ", nalBytes.at(idx));
}
printf("\n");
fclose(pFile_in);
return 0;
}
以第一节最后数据流为例,执行以上代码后,程序输出结果如下:
![]()
【视频编解码·学习笔记】4. H.264的码流封装格式 & 提取NAL有效数据的更多相关文章
- 【视频编解码·学习笔记】4. H.264的码流封装格式
一.码流封装格式简单介绍: H.264的语法元素进行编码后,生成的输出数据都封装为NAL Unit进行传递,多个NAL Unit的数据组合在一起形成总的输出码流.对于不同的应用场景,NAL规定了一种通 ...
- 视音频编解码学习工程:H.264分析器
=====================================================视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习工 ...
- 【视频编解码·学习笔记】6. H.264码流分析工程创建
一.准备工作: 新建一个VS工程SimpleH264Analyzer, 修改工程属性参数-> 输出目录:$(SolutionDir)bin\$(Configuration)\,工作目录:$(So ...
- 【视频编解码·学习笔记】8. 熵编码算法:基本算法列举 & 指数哥伦布编码
一.H.264中的熵编码基本方法: 熵编码具有消除数据之间统计冗余的功能,在编码端作为最后一道工序,将语法元素写入输出码流 熵解码作为解码过程的第一步,将码流解析出语法元素供后续步骤重建图像使用 在H ...
- 【视频编解码·学习笔记】11. 提取SPS信息程序
一.准备工作: 回到之前SimpleH264Analyzer程序,找到SPS信息,并对其做解析 调整项目目录结构: 修改Global.h文件中代码,添加新数据类型UINT16,之前编写的工程中,UIN ...
- 【视频编解码·学习笔记】5. NAL Unit 结构分析
在上篇笔记中通过一个小程序,可以提取NAL Unit所包含的的字节数据.H.264码流中的每一个NAL Unit的作用并不是相同的,而是根据不同的类型起不同的作用.下面将对NAL Unit中的数据进行 ...
- 【视频编解码·学习笔记】3. H.264视频编解码工程JM的下载与编解码
一.下载JM工程: JM是H.264标准制定团队所认可的官方参考软件.网址如下 http://iphome.hhi.de/suehring/tml/ 从页面中可找到相应的工程源码,本次选择JM 8.6 ...
- 【视频编解码·学习笔记】2. H.264简介
一.H.264视频编码标准 H.264视频编码标准是ITU-T与MPEG合作产生的又一巨大成果,自颁布之日起就在业界产生了巨大影响.严格地讲,H.264标准是属于MPEG-4家族的一部分,即MPEG- ...
- 【视频编解码·学习笔记】10. 序列参数集(SPS)介绍
一.SPS 相关概念: SPS即 "Sequence Paramater Set",又称作序列参数集. SPS中保存了一组编码视频序列(Coded video sequence)的 ...
随机推荐
- ora.ctssd OBSERVER
[grid@ydb1 ~]$ crsctl status res -t -init ora.ctssd 1 ONLINE ONLINE ydb1 ...
- 8. DBNEWID 工具(使用nid命令修改db name及dbid)
以下参考自:https://www.2cto.com/database/201305/207860.html Oralce官网:https://docs.oracle.com/cd/E11882_01 ...
- The number of sections contained in the collection view after the update (1) must be equal to the number of sections contained in the collection view before the update (0), plus or minus the number of
现象:当删除CollectionView 当中的某个section的时候,报上面的错误 初步分析:当前CollectionView删除前后都不止一个Section,怎么会报那样的错误:猜想可能是相册界 ...
- react 配置开发环境
一:先自行下载安装node和npm 二:cnpm install create-react-app -g 三:create-react-app my-project 四:cd my-project ...
- 19-3-15Python中闭包,迭代器,递归
函数名的使用 函数名可以当作值赋值给变量 函数名可以当作元素放到容器里 闭包 一个嵌套函数 在嵌套函数内的函数使用外部(非全局的变量) 满足以上两条就是闭包 python中闭包,会进行内存驻留,普通函 ...
- linux学习笔记一:远程连接linux服务器
环境介绍:win7电脑,通过VM虚拟出linux系统,安装centOS7 通过Xshell连接linux,ftp访问服务器资源. 遇到的问题,ftp连不上linux 解决:linux上安装ftp服务 ...
- SQL逻辑查询处理的步骤序号
(8)SELECT (9) DISTINCT <select_list> (1)FROM <left_table> (3)<join_type>JOIN<ri ...
- STM32 HAL库学习系列第2篇 GPIO配置
GPIO 库函数 基本就是使用以下几个函数 GPIO_PinState HAL_GPIO_ReadPin(GPIO_TypeDef* GPIOx, uint16_t GPIO_Pin); void H ...
- MLT的学习理解
MLT的学习理解 MLT是一个开源的多媒体库,我们的音视频编辑工具,是使用它作为底层支持,某司的'快剪辑'pc版和安卓版,也是用的它. MLT简介 它的GitHub地址,这个库比较老了,现在只有一个作 ...
- hadoop运维笔记
一. 故障处理部分 1.1. spark提交任务报错java.lang.NoClassDefFoundError: com/alibaba/fastjson/JSON 报错原因: 在运行环境没有找 ...