h.264的POC计算
本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_8K02pnnd_-Zd6ISnsOGWsGYb98ucLkELZO4nOv-X-v2GKLzI3r0VMN4R0TC8cM6AQy7xOjDZ4AQJBYWT_-VOYlxQFCvaj_
视频编码顺序与视频的播放顺序,并不完全相同
视频编码时,如果采用了B帧编码,由于B帧很多时候都是双向预测得来的,这时会先编码B帧的后向预测图像(P帧),然后再进行B帧编码,
因此会把视频原来的播放顺序打乱,以新的编码顺序输出码流
而在解码断接收到码流后,需要把顺序还原成原本的播放顺序,以输出正确的视频
在编解码中,视频的播放顺序序号叫做POC(picture order count)
POC有两种类型:
1、把POC的低位编进码流内 (pic_order_cnt_type = 0)
2、依赖frame_num求解POC (pic_order_cnt_type = 1)
对于第一种类型,POC的低位pic_order_cnt_lsb可以从码流内得到,而POC的高位PicOrderCntMsb则要求解码器自行计数
计数方式依赖于前一编码帧(PrevPicOrderCntMsb与PrevPicOrderCntLsb),代码如下
// Calculate the MSBs of current picture
if( img->pic_order_cnt_lsb < img->PrevPicOrderCntLsb &&
( img->PrevPicOrderCntLsb - img->pic_order_cnt_lsb ) >= ( MaxPicOrderCntLsb / ) )
img->PicOrderCntMsb = img->PrevPicOrderCntMsb + MaxPicOrderCntLsb;
else if ( img->pic_order_cnt_lsb > img->PrevPicOrderCntLsb &&
( img->pic_order_cnt_lsb - img->PrevPicOrderCntLsb ) > ( MaxPicOrderCntLsb / ) )
img->PicOrderCntMsb = img->PrevPicOrderCntMsb - MaxPicOrderCntLsb;
else
img->PicOrderCntMsb = img->PrevPicOrderCntMsb;
可以对比下图分析

如果序列内出现了mmco==5,
如果是场模式,并且出现在底场,PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零
如果出现在顶场,只需要清零PrevPicOrderCntMsb
如果mmco==5出现在帧模式,也是只清零PrevPicOrderCntMsb
另外如果出现了IDR,那么PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零
代码如下
// 1st
if(img->idr_flag)
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = ;
}
else
{
if (img->last_has_mmco_5)
{
if (img->last_pic_bottom_field)
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = ;
}
else
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = img->toppoc;
}
}
}
可以对比下图分析

对于第二种类型,是通过frame_num来计算得出POC
在解析步骤之前通过下图来分析一下帧序列结构

该序列分3个循环,
除开I帧外,每个循环有相同的结构其中frame_num是由解码器计数的,这里不在讨论范围内,直接拿来用,
另外有两个参数是从码流内(sps)获取:
num_ref_frames_in_pic_order_cnt_cycle 除I帧外,每个循环内有多少个参考帧(P帧)
offset_for_ref_frame[i] 一个循环内参考帧之间的间隔
假设我们需要计算POC为42的B帧的poc值
有如下步骤:
1、判断IDR,mmco==5
2、根据frame_num获取AbsFrameNum,如果是B帧则需要减一
3、计算POC,其中又分为以下几个步骤:
- 计算一个循环的长度,即offset_for_ref_frame[i]所有元素加起来,4+6+8 = 18
- 计算AbsFrameNum所在循环的位置(9-1)/ 3 = 2 ,即第三个循环
- 计算AbsFrameNum在循环内的偏移(9-1)%3 = 2,偏移2,即需要加上offset_for_ref_frame[0],offset_for_ref_frame[1]两个
- 计算前两个循环的长度 2x18 = 36
- 前两个循环长度加上偏移长度 36 + 4 + 6 = 46
- 由于是B帧,最后要加上offset_for_non_ref_pic,offset_for_non_ref_pic = -2*(连续B帧的数量),而这里由于有多个连续B帧,所以取平均值2,即 offset_for_non_ref_pic = -2*2 = -4
- 最后加上delta_pic_order_cnt[0] = 0,delta_pic_order_cnt[1] = 0 , 即POC = 42
代码如下:
case : // POC MODE 1
// 1st
if(img->idr_flag)
{
img->FrameNumOffset=; // first pix of IDRGOP,
img->delta_pic_order_cnt[]=; //ignore first delta
if(img->frame_num) error("frame_num != 0 in idr pix", -);
}
else
{
if (img->last_has_mmco_5)
{
img->PreviousFrameNumOffset = ;
img->PreviousFrameNum = ;
}
if (img->frame_num<img->PreviousFrameNum)
{ //not first pix of IDRGOP
img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;
}
else
{
img->FrameNumOffset = img->PreviousFrameNumOffset;
}
} // 2nd
if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)
img->AbsFrameNum = img->FrameNumOffset+img->frame_num;
else
img->AbsFrameNum=;
if(img->disposable_flag && img->AbsFrameNum>)
img->AbsFrameNum--; // 3rd
img->ExpectedDeltaPerPicOrderCntCycle=; if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)
for(i=;i<(int) active_sps->num_ref_frames_in_pic_order_cnt_cycle;i++)
img->ExpectedDeltaPerPicOrderCntCycle += active_sps->offset_for_ref_frame[i]; if(img->AbsFrameNum)
{
img->PicOrderCntCycleCnt = (img->AbsFrameNum-)/active_sps->num_ref_frames_in_pic_order_cnt_cycle;
img->FrameNumInPicOrderCntCycle = (img->AbsFrameNum-)%active_sps->num_ref_frames_in_pic_order_cnt_cycle;
img->ExpectedPicOrderCnt = img->PicOrderCntCycleCnt*img->ExpectedDeltaPerPicOrderCntCycle;
for(i=;i<=(int)img->FrameNumInPicOrderCntCycle;i++)
img->ExpectedPicOrderCnt += active_sps->offset_for_ref_frame[i];
}
else
img->ExpectedPicOrderCnt=; if(img->disposable_flag)
img->ExpectedPicOrderCnt += active_sps->offset_for_non_ref_pic; if(img->field_pic_flag==)
{ //frame pix
img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];
img->bottompoc = img->toppoc + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];
img->ThisPOC = img->framepoc = (img->toppoc < img->bottompoc)? img->toppoc : img->bottompoc; // POC200301
}
else if (img->bottom_field_flag==)
{ //top field
img->ThisPOC = img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];
}
else
{ //bottom field
img->ThisPOC = img->bottompoc = img->ExpectedPicOrderCnt + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];
}
img->framepoc=img->ThisPOC; img->PreviousFrameNum=img->frame_num;
img->PreviousFrameNumOffset=img->FrameNumOffset; break;
计算POC还有一种类型,这种最简单,直接通过frame_num推导,应用在没有连续的非参考帧的情况下(即一个间隔最多只能包含一个非参考帧)。
即没有B帧的,这种最简单,直接通过frame_num推导,
但是应该注意,在这种情况下不存在连续 的非参考图象(注释),且解码输出的顺序和显示输出顺序一致(注释),意思就是说不出现B帧,但可以出现非参考的P场,这也是为什么当 nal_ref_idc=0的时候
tempPicOrderCnt = 2 * ( FrameNumOffset + frame_num ) –1的情况。这里保证了参考场的POC始终为偶数,并且大于同帧的另外一个场

代码如下
case : // POC MODE 2
if(img->idr_flag) // IDR picture
{
img->FrameNumOffset=; // first pix of IDRGOP,
img->ThisPOC = img->framepoc = img->toppoc = img->bottompoc = ;
if(img->frame_num) error("frame_num != 0 in idr pix", -);
}
else
{
if (img->last_has_mmco_5)
{
img->PreviousFrameNum = ;
img->PreviousFrameNumOffset = ;
}
if (img->frame_num<img->PreviousFrameNum)
img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;
else
img->FrameNumOffset = img->PreviousFrameNumOffset; img->AbsFrameNum = img->FrameNumOffset+img->frame_num;
if(img->disposable_flag)
img->ThisPOC = (*img->AbsFrameNum - );
else
img->ThisPOC = (*img->AbsFrameNum); if (img->field_pic_flag==)
img->toppoc = img->bottompoc = img->framepoc = img->ThisPOC;
else if (img->bottom_field_flag==)
img->toppoc = img->framepoc = img->ThisPOC;
else img->bottompoc = img->framepoc = img->ThisPOC;
} if (!img->disposable_flag)
img->PreviousFrameNum=img->frame_num;
img->PreviousFrameNumOffset=img->FrameNumOffset;
break;
h.264的POC计算的更多相关文章
- h.264的POC计算(转载)
转自:http://www.cnblogs.com/TaigaCon/p/3551001.html 本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_ ...
- h.264语法结构分析
NAL Unit Stream Network Abstraction Layer,简称NAL. h.264把原始的yuv文件编码成码流文件,生成的码流文件就是NAL单元流(NAL unit Stre ...
- h.264参考图像列表、解码图像缓存
1.参考图像列表(reference picture list) 一般来说,h.264会把需要编码的图像分为三种类型:I.P.B,其中的B.P类型的图像由于采用了帧间编码的这种编码方式,而帧间编码又是 ...
- MPEG-4与H.264的区别 , 编码 以及 应用
MPEG4是适用于监控领域的压缩技术 MPEG4于1998年11月公布,原预计1999 年1月投入使用的国际标准MPEG4不仅是针对一定比特率下的视频.音频编码,更加注重多媒体系统的交互性和灵活性.M ...
- H.264学习笔记之一(层次结构,NAL,SPS)
一 H.264句法 1.1元素分层结构 H.264编码器输出的Bit流中,每个Bit都隶属于某个句法元素.句法元素被组织成有层次的结构,分别描述各个层次的信息. 图1 H.264分层结构由五层组成,分 ...
- h.264直接预测
直接预测是B帧上一种独有的预测方式,其中直接预测又分为两种模式: 时域直接模式(temporal direct).空域直接模式(spatial direct). 在分析这两种模式之前,有一个前提概念需 ...
- h.264加权预测
帧间运动是基于视频亮度(luma)不发生改变的一个假设,而在视频序列中经常能遇到亮度变化的场景,比如淡入淡出.镜头光圈调整.整体或局部光源改变等,在这些场景中,简单帧间运动补偿的效果可想而知(实际编码 ...
- FFmpeg的H.264解码器源代码简单分析:解析器(Parser)部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
- 7. H.264的句法和语义
1.句法 在编码器输出的码流中,数据的基本单位是句法元素,每个句法元素由若干比特组成,它表示某个特定的物理意义,例如:宏块类型.量化参数等. 句法表征句法元素的组织结构,语义阐述句法元素的具体含义. ...
随机推荐
- bzoj2049: [Sdoi2008]Cave 洞穴勘测
lct入门题? 得换根了吧TAT 这大概不是很成熟的版本.. #include<iostream> #include<cstring> #include<cstdlib& ...
- Hadoop 的子项目
Hadoop Common: 在0.20及以前的版本中,包含HDFS.MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Co ...
- Android Touch系统简介(二):实例详解onInterceptTouchEvent与onTouchEvent的调用过程
上一篇文章主要讲述了Android的TouchEvent的分发过程,其中有两个重要的函数:onInterceptTouchEvent和onTouchEvent,这两个函数可被重装以完成特定的逻辑.on ...
- 浅析mysql 共享表空间与独享表空间以及他们之间的转化
innodb这种引擎,与MYISAM引擎的区别很大.特别是它的数据存储格式等.对于innodb的数据结构,首先要解决两个概念性的问题: 共享表空间以及独占表空间.什么是共享表空间和独占表空间共 ...
- 一行代码实现iOS序列化与反序列化
一.变量声明 为便于下文讨论,提前创建父类Biology以及子类Person: Biology: @interface Biology : NSObject { NSInteger *_hairCou ...
- Linux shell入门基础(四)
四.进程优先级前台后台 01.进程控制 #find /name aaa & #ps aux | grep find #updatedb & #ps aux | grep update ...
- Codeforces 190E - Counter Attack
[题意]给一个无向图的反图(即给定的边实际上不存在,而未给的边是存在的),求连通块数.(点数n<=5*10^5,边数m<=10^6) 一开始我想的用DFS,枚举每一个点,跳过不存在的点,直 ...
- (Excel导出失败)检索COM类工厂中CLSID为{00024500-0000-0000-C000-000000000046}的组件时失
在DCOM 中不存在WORD.EXCEL等OFFICE组件 最近在做一个关于office转存PDF的Web项目.开发过程一切顺利. 起初在网上找到一些Word,PPT转PDF的代码.很好用.一切顺 ...
- get the text value of a selected option.
<select id="myselect"> <option value="1">Mr</option> <optio ...
- iOS 格式化输出符号与类型转换
1.iOS 格式化输出符号 %@ 对象 %d, %i 整数 %u 无符号整形 %f 浮点(双字节) %x, %X 二进制整数 %o 八进制整数 %zi ...