h.264的POC计算

本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_8K02pnnd_-Zd6ISnsOGWsGYb98ucLkELZO4nOv-X-v2GKLzI3r0VMN4R0TC8cM6AQy7xOjDZ4AQJBYWT_-VOYlxQFCvaj_

视频编码顺序与视频的播放顺序，并不完全相同

视频编码时，如果采用了B帧编码，由于B帧很多时候都是双向预测得来的，这时会先编码B帧的后向预测图像（P帧），然后再进行B帧编码，

因此会把视频原来的播放顺序打乱，以新的编码顺序输出码流

而在解码断接收到码流后，需要把顺序还原成原本的播放顺序，以输出正确的视频

在编解码中，视频的播放顺序序号叫做POC（picture order count）

POC有两种类型：

1、把POC的低位编进码流内（pic_order_cnt_type = 0）

2、依赖frame_num求解POC （pic_order_cnt_type = 1）

对于第一种类型，POC的低位pic_order_cnt_lsb可以从码流内得到，而POC的高位PicOrderCntMsb则要求解码器自行计数

计数方式依赖于前一编码帧（PrevPicOrderCntMsb与PrevPicOrderCntLsb），代码如下

    // Calculate the MSBs of current picture

    if( img->pic_order_cnt_lsb  <  img->PrevPicOrderCntLsb  &&

      ( img->PrevPicOrderCntLsb - img->pic_order_cnt_lsb )  >=  ( MaxPicOrderCntLsb /  ) )

      img->PicOrderCntMsb = img->PrevPicOrderCntMsb + MaxPicOrderCntLsb;

    else if ( img->pic_order_cnt_lsb  >  img->PrevPicOrderCntLsb  &&

      ( img->pic_order_cnt_lsb - img->PrevPicOrderCntLsb )  >  ( MaxPicOrderCntLsb /  ) )

      img->PicOrderCntMsb = img->PrevPicOrderCntMsb - MaxPicOrderCntLsb;

    else

      img->PicOrderCntMsb = img->PrevPicOrderCntMsb;

可以对比下图分析

如果序列内出现了mmco==5，
如果是场模式，并且出现在底场，PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零
如果出现在顶场，只需要清零PrevPicOrderCntMsb
如果mmco==5出现在帧模式，也是只清零PrevPicOrderCntMsb

另外如果出现了IDR，那么PrevPicOrderCntMsb与PrevPicOrderCntLsb都要清零

代码如下

    // 1st

    if(img->idr_flag)

    {

      img->PrevPicOrderCntMsb = ;

      img->PrevPicOrderCntLsb = ;

    }

    else

    {

      if (img->last_has_mmco_5)

      {

        if (img->last_pic_bottom_field)

        {

          img->PrevPicOrderCntMsb = ;

          img->PrevPicOrderCntLsb = ;

        }

        else

        {

          img->PrevPicOrderCntMsb = ;

          img->PrevPicOrderCntLsb = img->toppoc;

        }

      }

    }

可以对比下图分析

对于第二种类型，是通过frame_num来计算得出POC
在解析步骤之前通过下图来分析一下帧序列结构

该序列分3个循环，

除开I帧外，每个循环有相同的结构其中frame_num是由解码器计数的，这里不在讨论范围内，直接拿来用，

另外有两个参数是从码流内（sps）获取：

num_ref_frames_in_pic_order_cnt_cycle 除I帧外，每个循环内有多少个参考帧（P帧）

offset_for_ref_frame[i] 一个循环内参考帧之间的间隔

假设我们需要计算POC为42的B帧的poc值

有如下步骤：

1、判断IDR，mmco==5

2、根据frame_num获取AbsFrameNum，如果是B帧则需要减一

3、计算POC，其中又分为以下几个步骤：

计算一个循环的长度，即offset_for_ref_frame[i]所有元素加起来，4+6+8 = 18
计算AbsFrameNum所在循环的位置（9-1）/ 3 = 2 ，即第三个循环
计算AbsFrameNum在循环内的偏移（9-1）%3 = 2，偏移2，即需要加上offset_for_ref_frame[0],offset_for_ref_frame[1]两个
计算前两个循环的长度 2x18 = 36
前两个循环长度加上偏移长度 36 + 4 + 6 = 46
由于是B帧，最后要加上offset_for_non_ref_pic，offset_for_non_ref_pic = -2*(连续B帧的数量)，而这里由于有多个连续B帧，所以取平均值2，即 offset_for_non_ref_pic = -2*2 = -4
最后加上delta_pic_order_cnt[0] = 0，delta_pic_order_cnt[1] = 0 ，即POC = 42

代码如下：

  case : // POC MODE 1

    // 1st

    if(img->idr_flag)

    {

      img->FrameNumOffset=;     //  first pix of IDRGOP,

      img->delta_pic_order_cnt[]=;                        //ignore first delta

      if(img->frame_num)  error("frame_num != 0 in idr pix", -);

    }

    else

    {

      if (img->last_has_mmco_5)

      {

        img->PreviousFrameNumOffset = ;

        img->PreviousFrameNum = ;

      }

      if (img->frame_num<img->PreviousFrameNum)

      {             //not first pix of IDRGOP

        img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;

      }

      else

      {

        img->FrameNumOffset = img->PreviousFrameNumOffset;

      }

    }

    // 2nd

    if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)

      img->AbsFrameNum = img->FrameNumOffset+img->frame_num;

    else

      img->AbsFrameNum=;

    if(img->disposable_flag && img->AbsFrameNum>)

      img->AbsFrameNum--;

    // 3rd

    img->ExpectedDeltaPerPicOrderCntCycle=;

    if(active_sps->num_ref_frames_in_pic_order_cnt_cycle)

      for(i=;i<(int) active_sps->num_ref_frames_in_pic_order_cnt_cycle;i++)

        img->ExpectedDeltaPerPicOrderCntCycle += active_sps->offset_for_ref_frame[i];

    if(img->AbsFrameNum)

    {

      img->PicOrderCntCycleCnt = (img->AbsFrameNum-)/active_sps->num_ref_frames_in_pic_order_cnt_cycle;

      img->FrameNumInPicOrderCntCycle = (img->AbsFrameNum-)%active_sps->num_ref_frames_in_pic_order_cnt_cycle;

      img->ExpectedPicOrderCnt = img->PicOrderCntCycleCnt*img->ExpectedDeltaPerPicOrderCntCycle;

      for(i=;i<=(int)img->FrameNumInPicOrderCntCycle;i++)

        img->ExpectedPicOrderCnt += active_sps->offset_for_ref_frame[i];

    }

    else

      img->ExpectedPicOrderCnt=;

    if(img->disposable_flag)

      img->ExpectedPicOrderCnt += active_sps->offset_for_non_ref_pic;

    if(img->field_pic_flag==)

    {           //frame pix

      img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];

      img->bottompoc = img->toppoc + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];

      img->ThisPOC = img->framepoc = (img->toppoc < img->bottompoc)? img->toppoc : img->bottompoc; // POC200301

    }

    else if (img->bottom_field_flag==)

    {  //top field

      img->ThisPOC = img->toppoc = img->ExpectedPicOrderCnt + img->delta_pic_order_cnt[];

    }

    else

    {  //bottom field

      img->ThisPOC = img->bottompoc = img->ExpectedPicOrderCnt + active_sps->offset_for_top_to_bottom_field + img->delta_pic_order_cnt[];

    }

    img->framepoc=img->ThisPOC;

    img->PreviousFrameNum=img->frame_num;

    img->PreviousFrameNumOffset=img->FrameNumOffset;

    break;

计算POC还有一种类型，这种最简单，直接通过frame_num推导，应用在没有连续的非参考帧的情况下（即一个间隔最多只能包含一个非参考帧）。

即没有B帧的，这种最简单，直接通过frame_num推导，

但是应该注意，在这种情况下不存在连续的非参考图象（注释），且解码输出的顺序和显示输出顺序一致（注释），意思就是说不出现B帧，但可以出现非参考的P场，这也是为什么当 nal_ref_idc=0的时候

tempPicOrderCnt = 2 * ( FrameNumOffset + frame_num ) –1的情况。这里保证了参考场的POC始终为偶数，并且大于同帧的另外一个场

代码如下

  case : // POC MODE 2

    if(img->idr_flag) // IDR picture

    {

      img->FrameNumOffset=;     //  first pix of IDRGOP,

      img->ThisPOC = img->framepoc = img->toppoc = img->bottompoc = ;

      if(img->frame_num)  error("frame_num != 0 in idr pix", -);

    }

    else

    {

      if (img->last_has_mmco_5)

      {

        img->PreviousFrameNum = ;

        img->PreviousFrameNumOffset = ;

      }

      if (img->frame_num<img->PreviousFrameNum)

        img->FrameNumOffset = img->PreviousFrameNumOffset + img->MaxFrameNum;

      else

        img->FrameNumOffset = img->PreviousFrameNumOffset;

      img->AbsFrameNum = img->FrameNumOffset+img->frame_num;

      if(img->disposable_flag)

        img->ThisPOC = (*img->AbsFrameNum - );

      else

        img->ThisPOC = (*img->AbsFrameNum);

      if (img->field_pic_flag==)

        img->toppoc = img->bottompoc = img->framepoc = img->ThisPOC;

      else if (img->bottom_field_flag==)

         img->toppoc = img->framepoc = img->ThisPOC;

      else img->bottompoc = img->framepoc = img->ThisPOC;

    }

    if (!img->disposable_flag)

      img->PreviousFrameNum=img->frame_num;

    img->PreviousFrameNumOffset=img->FrameNumOffset;

    break;

h.264的POC计算的更多相关文章

h.264的POC计算（转载）
转自:http://www.cnblogs.com/TaigaCon/p/3551001.html 本文参考自http://wenku.baidu.com/link?url=ZPF0iSKzwLQg_ ...
h.264语法结构分析
NAL Unit Stream Network Abstraction Layer,简称NAL. h.264把原始的yuv文件编码成码流文件,生成的码流文件就是NAL单元流(NAL unit Stre ...
h.264参考图像列表、解码图像缓存
1.参考图像列表(reference picture list) 一般来说,h.264会把需要编码的图像分为三种类型:I.P.B,其中的B.P类型的图像由于采用了帧间编码的这种编码方式,而帧间编码又是 ...
MPEG-4与H.264的区别，编码以及应用
MPEG4是适用于监控领域的压缩技术 MPEG4于1998年11月公布,原预计1999 年1月投入使用的国际标准MPEG4不仅是针对一定比特率下的视频.音频编码,更加注重多媒体系统的交互性和灵活性.M ...
H.264学习笔记之一（层次结构，NAL，SPS）
一 H.264句法 1.1元素分层结构 H.264编码器输出的Bit流中,每个Bit都隶属于某个句法元素.句法元素被组织成有层次的结构,分别描述各个层次的信息. 图1 H.264分层结构由五层组成,分 ...
h.264直接预测
直接预测是B帧上一种独有的预测方式,其中直接预测又分为两种模式: 时域直接模式(temporal direct).空域直接模式(spatial direct). 在分析这两种模式之前,有一个前提概念需 ...
h.264加权预测
帧间运动是基于视频亮度(luma)不发生改变的一个假设,而在视频序列中经常能遇到亮度变化的场景,比如淡入淡出.镜头光圈调整.整体或局部光源改变等,在这些场景中,简单帧间运动补偿的效果可想而知(实际编码 ...
FFmpeg的H.264解码器源代码简单分析：解析器（Parser）部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
7. H.264的句法和语义
1.句法在编码器输出的码流中,数据的基本单位是句法元素,每个句法元素由若干比特组成,它表示某个特定的物理意义,例如:宏块类型.量化参数等. 句法表征句法元素的组织结构,语义阐述句法元素的具体含义. ...

随机推荐

uva12118
一开始以为直接算联通块个数就行了后来发现还得分联通块里的奇点... 还要注意m = 0的情况... #include<iostream> #include<algorithm> ...
iframe页面改动parent页面的隐藏input部件value值，不能触发change事件。
实现一个依据iframe页面返回充值卡类型不同,安排不同的input部件. 点击选择弹出一个iframe.点击充值卡数据行.返回1.充值卡类型.2.充值卡id(用的UUID).3.充值卡号(字符串). ...
【转】 Android Studio SVN 使用方法
Android Studio SVN 使用方法如何安装配置SVN 请直接参考<SVN在Android Studio中的配置> http://www.cnblogs.com/songmen ...
Windows环境下安装IPython NoteBook
本文的环境:64位windows8,32位python2.7.首先你要保证电脑上装有python,并且设置成环境变量. 1.windows命令行进入到python目录下的Scripts文件,或者在该目 ...
用crontab设置svn的定期更新任务
本以为用crontab设置svn的定期更新任务是件非常容易的事情,实践后方才知道,其实并不那么容易.设置例行性工作如下:0 8 * * * /usr/bin/svn up /data/test第二天, ...
[转] 关于c++的头文件依赖
http://www.cnblogs.com/yvesliao/p/3938730.html PS: 使用单向依赖正在看google c++编程规范,里面对头文件依赖是这么说的: 1 2 3 4 5 ...
Getting Started with the NDK
The Native Development Kit (NDK) is a set of tools that allow you to leverage C and C++ code in your ...
ASP.NET过滤器、URL重写
过滤器可以对指定的URL访问进行拦截,并执行过滤器的方法,根据实际应用情况,在过滤器中修改请求的代码.判断会话信息,也可以做权限控制. 一:编写过滤器,实现URL重写并配置过滤编写过滤器,就是编写一 ...
python学习之成员信息增删改查
主要实现了成员信息的增加,修改,查询,和删除功能,写着玩玩,在写的过程中,遇到的问题,旧新成员信息数据的合并,手机号和邮箱的验证,#!/usr/bin/env python# coding=utf8# ...
Day11 - Mysql and ORM
python 之路,Day11 - python mysql and ORM 本节内容数据库介绍 mysql 数据库安装使用 mysql管理 mysql 数据类型常用mysql命令创建数据库 ...

h.264的POC计算

h.264的POC计算的更多相关文章

随机推荐

热门专题