Rate Distortion Optimization

搜索时，一个不可避免的问题就是如何对mv进行比较，从而得到最优

对于同一压缩算法来说，码率越高表示图像质量越好、失真越小，但是码率越高要求更大的存储空间，也会增加网络传输的压力。因此在码率与失真中找出平衡点，使压缩效果最优，这种方法叫做R-D Optimization（码率失真优化）

典型的高码率下，码率与失真关系（R-D关系式）为

$R(D) = {\alpha}{ln(\frac{\delta^2}{D})}$

$R$为码率，$\alpha$为系数，$\delta^2$为方差，$D$为失真。

方差越大，意味着图像细节越多，因此码率也会越大；失真越大，意味着图像由于压缩所损失的细节越多，那么码率越小。

R-D曲线

R与D好比鱼与熊掌，取一方，必然会舍去另一方，两者不可能都取得最佳，因此如何取舍，就需要权衡利弊。最好的方法，就是看哪个权重大，哪个的比例就大，权重小的比例小，这就是拉格朗日方法。

拉格朗日代价函数为：

$J = D + \lambda_{MODE} \cdot R$

要使得代价最小，那么在其导数为0处有最小值：

$\frac{dJ}{dR} = \frac{dD}{dR} + \lambda_{MODE} = 0$

现假设D与R的权重比为$\lambda_{MODE}$，并假设上方点A为根据上方结论得到的最佳位置，那么点A处有斜率：

$k = -\lambda_{MODE} = \frac{dD}{dR}$

又因为可以通过对R-D关系式求导，然后整理得：

$\frac{dD}{dR} = -\frac{D}{\alpha}$

因此，在R-D最优点处有：

$\lambda_{MODE} = \frac{D}{\alpha}$

另外，在典型的高码率下，失真近似满足公式：

$D = \frac{ ( 2 \cdot QUANT )^2}{12}$

把D代入上述公式，得到：

$\lambda_{MODE} = \frac{1}{3\alpha}\cdot QUANT^2$

即：

$\lambda_{MODE} = \zeta\cdot QUANT^2$

最终可以通过函数拟合得到$\zeta = 0.85$，在h.264中，当存在B帧编码时$\zeta = 0.68$，则有：

$\begin{align*}
\lambda_{MODE}
&= 0.68\cdot QUANT^2 \\
&= 0.68 \cdot (2^\frac{QP - 12}{6})^2 \\
&= 0.68\cdot 2^\frac{QP - 12}{3}
\end{align*}$

注：QP在这里减去12是因为在h.264早期只有40个QP，而现在由52个QP

由于上面计算的时候用的是$\delta^2$（方差），即SSD，但是实际上h.264计算用的是

$\begin{align*}
SAD &= \sum_{(x,y)\in A}\left | s[x,y] - s'[x,y]\right | \\
SSD &= \sum_{(x,y)\in A}\left | s[x,y] - s'[x,y]\right |^2
\end{align*}$

那么

$\lambda_{MOTION} = \sqrt{\lambda_{MODE}}$

为了方便计算，在一般h.264的编码器中采用的都是

$D = SAD$

而R则需要知道当前所选择的mv与ref所占用的bit，而这些都是可以事先计算出来的，在JM中不同的mv与ref所占的bit都在编码前被初始化了，用数组存储起来。mv与ref采用的都是哥伦布编码。

$R = Bit_{mv} + Bit_{ref}$

h.264 率失真优化的更多相关文章

H.264学习笔记3——帧间预测
帧间预测主要包括运动估计(运动搜索方法.运动估计准则.亚像素插值和运动矢量估计)和运动补偿. 对于H.264,是对16x16的亮度块和8x8的色度块进行帧间预测编码. A.树状结构分块 H.264的宏 ...
H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
【图像处理】H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
x264 - 高品质 H.264 编码器
转自:http://www.5i01.cn/topicdetail.php?f=510&t=3735840&r=18&last=48592660 H.264 / MPEG-4 ...
H.264简介
H.264/MPEG-4 AVC (H.264) 是1995年自MPEG-2视频压缩标准发布以后最新的, 最有前途的视频压缩标准. H.264是由ITU-U和ISO/IEC联合开发组共同开发的最新国际 ...
转：MediaCoder H.264格式编码参数设置及详解
转: http://mediacoder.com.cn/node/81 由于现在大部分视频转码都选择H.264格式进行编码,同时CUDA编码的画质还达不到x264软编码的质量(如果你对画质无要求,可以 ...
H.264视频的RTP荷载格式
Status of This Memo This document specifies an Internet standards track protocol for the Internet ...
音视频编解码技术（一）：MPEG-4/H.264 AVC 编解码标准
一.H264 概述 H.264,通常也被称之为H.264/AVC(或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC) 1. H.264视频编解码的意义 H.264的出现就是为了创 ...
h.264并行熵解码
在前面讨论并行解码的章节中,我们专注于讨论解码的宏块重建部分,甚至把宏块重建描述成宏块解码,这是因为在解码工作中,宏块重建确实占了相当大的比重,不过解码还包含其它的部分,按照解码流程可粗略分为: 读取 ...

随机推荐

Genymotion开始搞起~
简介一:什么是GenymotionGenymotion是一款完全超越BlueStacks的安卓模拟器,正如它中文官网的介绍:快到极致的Android模拟器.英文官网:http://www.genym ...
iOS人脸识别(CoreImage)
1.从初始UIImage获取一个CIImage对象. 2.创建一个用于分析对象的CIContext. 3.通过type和options参数创建一个CIDetector实例. type参数指定了要识别的 ...
Android 开源项目 eoe 社区 Android 客户端（转）
本文内容环境开源项目 eoe 社区 Android 客户端本文介绍 eoe 社区 Android 客户端.它是一个开源项目,功能相对简单,采用侧边菜单栏.可以学习一下.点击此处查看 GitHub ...
POJ 2049 Finding Nemo
Finding Nemo Time Limit: 2000MS Memory Limit: 30000K Total Submissions: 8631 Accepted: 2019 Desc ...
Linux开发工具之gdb（下）
三.gdb调试(下) 01.查看运行时数据 print - 查看变量值 ptype - 查看类型 print array - 查看数组 print *array@len - 查看动态内存 print ...
codevs 4909 寂寞的堆（写的好丑0.0）
#include<iostream> #include<cstdio> #include<cstring> #include<cmath> #defin ...
css.day.05.eg
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
PHP 关于文件操作的简单介绍
文件操作一直是Web程序员头疼的地方,而文件操作在CMS这样的系统中又是必须的.如今,PHP文件操作的函数内容已经非常强大,文件这部分也是学习PHP非常重要的一部分,希望大家不要忽略.这篇文章会简单介 ...
ASPNET5 管理应用程序的状态
1. 应用程序状态选项在ASP.NET5当中,全局的Application对象没有了,转而被In Memory Caching所代替,ASPNET5当中有下多种管理状态的方式: HttpContex ...
(转) dedecms中自定义数据模型
刚学习完dedecms的标签语法,我有很多困惑,觉得标签的意义比较抽象,不知道如何用标签来写一些具体的内容.如果有一些数据库的编程经验,就知道一个很常用的编程范例—增删改查.比如说,我要建立的是书本的 ...

h.264 率失真优化

Rate Distortion Optimization

h.264 率失真优化的更多相关文章

随机推荐

热门专题