本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_8K02pnnd_-Zd6ISnsOGWsGYb98ucLkELZO4nOv-X-v2GKLzI3r0VMN4R0TC8cM6AQy7xOjDZ4AQJBYWT_-VOYlxQFCvaj_

视频编码顺序与视频的播放顺序,并不完全相同

视频编码时,如果采用了B帧编码,由于B帧很多时候都是双向预测得来的,这时会先编码B帧的后向预测图像(P帧),然后再进行B帧编码,

因此会把视频原来的播放顺序打乱,以新的编码顺序输出码流

而在解码断接收到码流后,需要把顺序还原成原本的播放顺序,以输出正确的视频

在编解码中,视频的播放顺序序号叫做POC(picture order count)

POC有两种类型:

1、把POC的低位编进码流内        (pic_order_cnt_type = 0)

2、依赖frame_num求解POC      (pic_order_cnt_type = 1)

对于第一种类型,POC的低位pic_order_cnt_lsb可以从码流内得到,而POC的高位PicOrderCntMsb则要求解码器自行计数

计数方式依赖于前一编码帧(PrevPicOrderCntMsb与PrevPicOrderCntLsb),代码如下

    // Calculate the MSBs of current picture
if( img->pic_order_cnt_lsb < img->PrevPicOrderCntLsb &&
( img->PrevPicOrderCntLsb - img->pic_order_cnt_lsb ) >= ( MaxPicOrderCntLsb / ) )
img->PicOrderCntMsb = img->PrevPicOrderCntMsb + MaxPicOrderCntLsb;
else if ( img->pic_order_cnt_lsb > img->PrevPicOrderCntLsb &&
( img->pic_order_cnt_lsb - img->PrevPicOrderCntLsb ) > ( MaxPicOrderCntLsb / ) )
img->PicOrderCntMsb = img->PrevPicOrderCntMsb - MaxPicOrderCntLsb;
else
img->PicOrderCntMsb = img->PrevPicOrderCntMsb;

可以对比下图分析

如果序列内出现了mmco==5,
如果是场模式,并且出现在底场,PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零
如果出现在顶场,只需要清零PrevPicOrderCntMsb
如果mmco==5出现在帧模式,也是只清零PrevPicOrderCntMsb

另外如果出现了IDR,那么PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零

代码如下

    // 1st
if(img->idr_flag)
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = ;
}
else
{
if (img->last_has_mmco_5)
{
if (img->last_pic_bottom_field)
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = ;
}
else
{
img->PrevPicOrderCntMsb = ;
img->PrevPicOrderCntLsb = img->toppoc;
}
}
}

可以对比下图分析

对于第二种类型,是通过frame_num来计算得出POC
在解析步骤之前通过下图来分析一下帧序列结构

该序列分3个循环,

除开I帧外,每个循环有相同的结构其中frame_num是由解码器计数的,这里不在讨论范围内,直接拿来用,

另外有两个参数是从码流内(sps)获取:

num_ref_frames_in_pic_order_cnt_cycle    除I帧外,每个循环内有多少个参考帧(P帧)

offset_for_ref_frame[i]                             一个循环内参考帧之间的间隔

假设我们需要计算POC为42的B帧的poc值

有如下步骤:

1、判断IDR,mmco==5

2、根据frame_num获取AbsFrameNum,如果是B帧则需要减一

3、计算POC,其中又分为以下几个步骤:

  • 计算一个循环的长度,即offset_for_ref_frame[i]所有元素加起来,4+6+8 = 18
  • 计算AbsFrameNum所在循环的位置(9-1)/ 3 = 2 ,即第三个循环
  • 计算AbsFrameNum在循环内的偏移(9-1)%3 = 2,偏移2,即需要加上offset_for_ref_frame[0],offset_for_ref_frame[1]两个
  • 计算前两个循环的长度 2x18 = 36
  • 前两个循环长度加上偏移长度 36 + 4 + 6 = 46
  • 由于是B帧,最后要加上offset_for_non_ref_pic,offset_for_non_ref_pic = -2*(连续B帧的数量),而这里由于有多个连续B帧,所以取平均值2,即 offset_for_non_ref_pic = -2*2 = -4
  • 最后加上delta_pic_order_cnt[0] = 0,delta_pic_order_cnt[1] = 0 , 即POC = 42

代码如下:

  case : // POC MODE 1
// 1st
if(img->idr_flag)
{
img->FrameNumOffset=; // first pix of IDRGOP,
img->delta_pic_order_cnt[]=; //ignore first delta
if(img->frame_num) error("frame_num != 0 in idr pix", -);
}
else
{
if (img->last_has_mmco_5)
{
img->PreviousFrameNumOffset = ;
img->PreviousFrameNum = ;
}
if (img->frame_num<img->PreviousFrameNum)
{ //not first pix of IDRGOP
img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;
}
else
{
img->FrameNumOffset = img->PreviousFrameNumOffset;
}
} // 2nd
if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)
img->AbsFrameNum = img->FrameNumOffset+img->frame_num;
else
img->AbsFrameNum=;
if(img->disposable_flag && img->AbsFrameNum>)
img->AbsFrameNum--; // 3rd
img->ExpectedDeltaPerPicOrderCntCycle=; if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)
for(i=;i<(int) active_sps->num_ref_frames_in_pic_order_cnt_cycle;i++)
img->ExpectedDeltaPerPicOrderCntCycle += active_sps->offset_for_ref_frame[i]; if(img->AbsFrameNum)
{
img->PicOrderCntCycleCnt = (img->AbsFrameNum-)/active_sps->num_ref_frames_in_pic_order_cnt_cycle;
img->FrameNumInPicOrderCntCycle = (img->AbsFrameNum-)%active_sps->num_ref_frames_in_pic_order_cnt_cycle;
img->ExpectedPicOrderCnt = img->PicOrderCntCycleCnt*img->ExpectedDeltaPerPicOrderCntCycle;
for(i=;i<=(int)img->FrameNumInPicOrderCntCycle;i++)
img->ExpectedPicOrderCnt += active_sps->offset_for_ref_frame[i];
}
else
img->ExpectedPicOrderCnt=; if(img->disposable_flag)
img->ExpectedPicOrderCnt += active_sps->offset_for_non_ref_pic; if(img->field_pic_flag==)
{ //frame pix
img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];
img->bottompoc = img->toppoc + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];
img->ThisPOC = img->framepoc = (img->toppoc < img->bottompoc)? img->toppoc : img->bottompoc; // POC200301
}
else if (img->bottom_field_flag==)
{ //top field
img->ThisPOC = img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];
}
else
{ //bottom field
img->ThisPOC = img->bottompoc = img->ExpectedPicOrderCnt + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];
}
img->framepoc=img->ThisPOC; img->PreviousFrameNum=img->frame_num;
img->PreviousFrameNumOffset=img->FrameNumOffset; break;

  

计算POC还有一种类型,这种最简单,直接通过frame_num推导,应用在没有连续的非参考帧的情况下(即一个间隔最多只能包含一个非参考帧)。

即没有B帧的,这种最简单,直接通过frame_num推导,

但是应该注意,在这种情况下不存在连续 的非参考图象(注释),且解码输出的顺序和显示输出顺序一致(注释),意思就是说不出现B帧,但可以出现非参考的P场,这也是为什么当 nal_ref_idc=0的时候

tempPicOrderCnt = 2 * ( FrameNumOffset + frame_num ) –1的情况。这里保证了参考场的POC始终为偶数,并且大于同帧的另外一个场

代码如下

  case : // POC MODE 2
if(img->idr_flag) // IDR picture
{
img->FrameNumOffset=; // first pix of IDRGOP,
img->ThisPOC = img->framepoc = img->toppoc = img->bottompoc = ;
if(img->frame_num) error("frame_num != 0 in idr pix", -);
}
else
{
if (img->last_has_mmco_5)
{
img->PreviousFrameNum = ;
img->PreviousFrameNumOffset = ;
}
if (img->frame_num<img->PreviousFrameNum)
img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;
else
img->FrameNumOffset = img->PreviousFrameNumOffset; img->AbsFrameNum = img->FrameNumOffset+img->frame_num;
if(img->disposable_flag)
img->ThisPOC = (*img->AbsFrameNum - );
else
img->ThisPOC = (*img->AbsFrameNum); if (img->field_pic_flag==)
img->toppoc = img->bottompoc = img->framepoc = img->ThisPOC;
else if (img->bottom_field_flag==)
img->toppoc = img->framepoc = img->ThisPOC;
else img->bottompoc = img->framepoc = img->ThisPOC;
} if (!img->disposable_flag)
img->PreviousFrameNum=img->frame_num;
img->PreviousFrameNumOffset=img->FrameNumOffset;
break;

h.264的POC计算的更多相关文章

  1. h.264的POC计算(转载)

    转自:http://www.cnblogs.com/TaigaCon/p/3551001.html 本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_ ...

  2. h.264语法结构分析

    NAL Unit Stream Network Abstraction Layer,简称NAL. h.264把原始的yuv文件编码成码流文件,生成的码流文件就是NAL单元流(NAL unit Stre ...

  3. h.264参考图像列表、解码图像缓存

    1.参考图像列表(reference picture list) 一般来说,h.264会把需要编码的图像分为三种类型:I.P.B,其中的B.P类型的图像由于采用了帧间编码的这种编码方式,而帧间编码又是 ...

  4. MPEG-4与H.264的区别 , 编码 以及 应用

    MPEG4是适用于监控领域的压缩技术 MPEG4于1998年11月公布,原预计1999 年1月投入使用的国际标准MPEG4不仅是针对一定比特率下的视频.音频编码,更加注重多媒体系统的交互性和灵活性.M ...

  5. H.264学习笔记之一(层次结构,NAL,SPS)

    一 H.264句法 1.1元素分层结构 H.264编码器输出的Bit流中,每个Bit都隶属于某个句法元素.句法元素被组织成有层次的结构,分别描述各个层次的信息. 图1 H.264分层结构由五层组成,分 ...

  6. h.264直接预测

    直接预测是B帧上一种独有的预测方式,其中直接预测又分为两种模式: 时域直接模式(temporal direct).空域直接模式(spatial direct). 在分析这两种模式之前,有一个前提概念需 ...

  7. h.264加权预测

    帧间运动是基于视频亮度(luma)不发生改变的一个假设,而在视频序列中经常能遇到亮度变化的场景,比如淡入淡出.镜头光圈调整.整体或局部光源改变等,在这些场景中,简单帧间运动补偿的效果可想而知(实际编码 ...

  8. FFmpeg的H.264解码器源代码简单分析:解析器(Parser)部分

    ===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...

  9. 7. H.264的句法和语义

    1.句法 在编码器输出的码流中,数据的基本单位是句法元素,每个句法元素由若干比特组成,它表示某个特定的物理意义,例如:宏块类型.量化参数等. 句法表征句法元素的组织结构,语义阐述句法元素的具体含义. ...

随机推荐

  1. scrollview中停止滚动的监听

    [补充]可以在主线程控制,特别注意 scrollView3.postDelayed(new Runnable() { @Override public void run() { scrollView3 ...

  2. linux 获取系统屏幕分辨率

      在Windows下可以使用GetSystemMetrics(SM_CXSCREEN);GetSystemMetrics(SM_CYSCREEN) 获取. 在Linux下可以使用XDisplayWi ...

  3. [转] 怎样快速而优雅地遍历 JavaScript 数组

    我们一般用循环来遍历数组,而循环一直是 JavaScript 性能问题的常见来源,有时循环用得不好会严重降低代码的运行速度.例如,遍历数组时,我们会很自然地写出下面这种代码: // 未优化的代码1 v ...

  4. [转] C++临时变量的生命周期

    http://www.cnblogs.com/catch/p/3251937.html C++中的临时变量指的是那些由编译器根据需要在栈上产生的,没有名字的变量. 主要的用途主要有两类: 1) 函数的 ...

  5. TCP的封包与拆包

    对于基于TCP开发的通讯程序,有个很重要的问题需要解决,就是封包和拆包. 一.为什么基于TCP的通讯程序需要进行封包和拆包. TCP是个"流"协议,所谓流,就是没有界限的一串数据. ...

  6. Java基础知识强化19:Java中switch分支语句

    java中switch语句: 这里expression控制表达式的数据类型只能是byte.short.char.int四种整型类型和枚举类型,不能是boolean类型: Java7(1.7)改进了sw ...

  7. .net之页面生面周期

    # 事件或方法 功能 描述 1 Init 事件 页面初始化 页面生存周期中的第一个阶段是初始化.当 Init 事件发生时,在.aspx 源文件中静态声明的所有控件都已实例化并取其默认值.应该注意的是, ...

  8. ZOJ1463

    题意:给一个括号字符串,求解最少添加的字符能使整个字符串匹配. 输入: s(未匹配的字符串) 输出: S(匹配后的字符串) 思路:绝壁超级坑的一道题,格式我不想说什么了,特坑,然后就是对给定的字符串, ...

  9. MVC3 展示数据含有html代码处理,配合上篇发布的StringHelper

    @Html.Raw(@StringHelper.SubstringToHTML(Content,30)) StringHelper 地址:http://www.cnblogs.com/Jiawt/p/ ...

  10. 关于Jquery.Data()和HTML标签的data-*属性

    人们总喜欢往HTML标签上添加自定义属性来存储和操作数据.但这样做的问题是,你不知道将来会不会有其它脚本把你的自定义属性给重置掉,此外,你这样做也会导致html语法上不符合Html规范,以及一些其它副 ...