17_详解YUV

本文的主角是多媒体领域非常重要的一个概念：YUV。

简介

YUV，是一种颜色编码方法，跟RGB是同一个级别的概念，广泛应用于多媒体领域中。

也就是说，图像中每1个像素的颜色信息，除了可以用RGB的方式表示，也可以用YUV的方式表示。

vs RGB

对比RGB，YUV有哪些不同和优势呢？

体积更小

如果使用RGB
- 比如RGB888（R、G、B每个分量都是8bit）
- 1个像素占用24bit（3字节）
如果使用YUV
- 1个像素可以减小至平均只占用12bit（1.5字节）
- 体积为RGB888的一半

组成

RGB数据由R、G、B三个分量组成。

YUV数据由Y、U、V三个分量组成，现在通常说的YUV指的是YCbCr。

Y：表示亮度（Luminance、Luma），占8bit（1字节）
Cb、Cr：表示色度（Chrominance、Chroma）
- Cb（U）：蓝色色度分量，占8bit（1字节）
- Cr（V）：红色色度分量，占8bit（1字节）

兼容性

根据上面的图片，不难看出：

Y分量对呈现出清晰的图像有着很大的贡献
Cb、Cr分量的内容不太容易识别清楚

此外，你是否感觉：Y分量的内容看着有点眼熟？其实以前黑白电视的画面就是长这样子的。

YUV的发明处在彩色电视与黑白电视的过渡时期。

YUV将亮度信息（Y）与色度信息（UV）分离，没有UV信息一样可以显示完整的图像，只不过是黑白的
这样的设计很好地解决了彩色电视与黑白电视的兼容性问题，使黑白电视也能够接收彩色电视信号，只不过它只显示了Y分量
彩色电视有Y、U、V分量，如果去掉UV分量，剩下的Y分量和黑白电视相同

转换

公式1

Y = 0.257R + 0.504G + 0.098B + 16

U = -0.148R - 0.291G + 0.439B + 128

V = 0.439R - 0.368G - 0.071B + 128

R = 1.164(Y - 16) + 2.018(U - 128)

G = 1.164(Y - 16) - 0.813(V - 128) - 0.391(U - 128)

B = 1.164(Y - 16) + 1.596(V - 128)

RGB的取值范围是[0,255]
Y的取值范围是[16,235]
UV的取值范围是[16,239]

公式2

Y = 0.299R + 0.587G + 0.114B

U = 0.564(B - Y) = -0.169R - 0.331G + 0.500B

V = 0.713(R - Y) = 0.500R - 0.419G - 0.081B

R = Y + 1.403V

G = Y - 0.344U - 0.714V

B = Y + 1.770U

RGB的取值范围是[0, 1]
Y的取值范围是[0, 1]
UV的取值范围是[-0.5, 0.5]

公式3

Y = 0.299R + 0.587G + 0.114B

U = -0.169R - 0.331G + 0.500B + 128

V = 0.500R - 0.419G - 0.081B + 128

R = Y + 1.403(V - 128)

G = Y - 0.343(U - 128) - 0.714(V - 128)

B = Y + 1.770(U - 128)

RGB的取值范围是[0, 255]
YUV的取值范围是[0, 255]

色度二次采样

原理

人眼的视网膜上，分布着两种感光细胞：视杆细胞和视锥细胞。

视杆细胞
- 感知光线的强弱
- 没有色彩识别功能
- 负责夜间非彩色视觉
视锥细胞
- 感知颜色
- 负责白天彩色视觉
- 如果你的视锥细胞发育不正常，数量太少，那感知颜色就会受阻，可能会导致你色弱

人眼中有上亿个感光细胞，其中视杆细胞占了95%，而视锥细胞仅占5%。

因此，人眼对亮度的敏感程度要高于对色度的敏感程度，人眼对于亮度的分辨要比对颜色的分辨精细一些。

如果把图像的色度分量减少一些，人眼也丝毫感觉不到变化和差异。

概念

如果在色度分量上进行（相对亮度分量）较低分辨率的采样，也就是存储较多的亮度细节、较少的色度细节，这样就可以在不明显降低画面质量的同时减小图像的体积。上述过程称为：色度二次采样（Chroma Subsampling）。

采样格式

采样格式通常用A:B:C的形式来表示，比如4:4:4、4:2:2、4:2:0等，其中我们最需要关注的是4:2:0。

A：一块A*2个像素的概念区域，一般都是4
B：第1行的色度采样数目
C：第2行的色度采样数目
- C的值一般要么等于B，要么等于0

上图中，不管是哪种采样格式，Y分量都是全水平、全垂直分辨率采样的，每一个像素都有自己独立的Y分量。

4:4:4

第1行采集4组CbCr分量，第2行采集4组CbCr分量
每1个像素都有自己独立的1组CbCr分量
- Y分量与CbCr分量的水平方向比例是1:1（每1列都有1组CbCr分量）
- Y分量与CbCr分量的垂直方向比例是1:1（每1行都有1组CbCr分量）
- Y分量与CbCr分量的总比例是1:1
1个像素占用24bit（3字节），跟RGB888的体积一样
- 24bpp（bits per pixel）
这种格式是没有进行色度二次采样的

叉叉代表：亮度。

圆圈代表：色度。

4:2:2

第1行采集2组CbCr分量，第2行采集2组CbCr分量
水平方向相邻的2个像素（1行2列）共用1组CbCr分量
- Y分量与CbCr分量的水平方向比例是2:1（每2列就有1组CbCr分量）
- Y分量与CbCr分量的垂直方向比例是1:1（每1行都有1组CbCr分量）
- Y分量与CbCr分量的总比例是2:1
1个像素平均占用16bit（2字节）
- 16bpp
- 因为2个像素共占用32bit（4字节 = 2个Y分量 + 1个Cb分量 + 1个Cr分量）

4:2:0

第1行采集2组CbCr分量，第2行共享第1行的CbCr分量
相邻的4个像素（2行2列）共用1组CbCr分量
- Y分量与CbCr分量的水平方向比例是2:1（每2列就有1组CbCr分量）
- Y分量与CbCr分量的垂直方向比例是2:1（每2行就有1组CbCr分量）
- Y分量与CbCr分量的总比例是4:1
1个像素平均占用12bit（1.5字节）
- 12bpp
- 因为4个像素共占用48bit（6字节 = 4个Y分量 + 1个Cb分量 + 1个Cr分量）

存储格式

存储格式，决定了YUV数据是如何排列和存储的。本文只介绍一些常见的存储格式。

4:4:4

Planar

I444

Y Y Y Y

Y Y Y Y

U U U U

U U U U

V V V V

V V V V

YV24

Y Y Y Y

Y Y Y Y

V V V V

V V V V

U U U U

U U U U

Semi-Planar

NV24

Y Y Y Y

Y Y Y Y

U V U V U V U V

U V U V U V U V

NV42

Y Y Y Y

Y Y Y Y

V U V U V U V U

V U V U V U V U

4:2:2

Planar

I422

Y Y Y Y

Y Y Y Y

U U

U U

V V

V V

YV16

Y Y Y Y

Y Y Y Y

V V

V V

U U

U U

Semi-Planar

NV16

Y Y Y Y

Y Y Y Y

U V U V

U V U V

NV61

Y Y Y Y

Y Y Y Y

V U V U

V U V U

Packed

UYVY

U Y V Y U Y V Y

U Y V Y U Y V Y

YUYV

Y U Y V Y U Y V

Y U Y V Y U Y V

YVYU

Y V Y U Y V Y U

Y V Y U Y V Y U

4:2:0

Planar

I420
- 大多数视频解码器以I420格式输出原始图片

Y Y Y Y

Y Y Y Y

U U

V V

YV12

Y Y Y Y

Y Y Y Y

V V

U U

Semi-Planar

NV12

Y Y Y Y

Y Y Y Y

U V U V

NV21

Y Y Y Y

Y Y Y Y

V U V U

格式转换

其他图片格式转YUV

ffmpeg -i in.png -s 512x512 -pix_fmt yuv420p out.yuv

上述命令生成的yuv文件大小是：393216字节 = 512 * 512 * 1.5字节。

-s
- 设置图片的尺寸
- 可以用一些固定字符串表示尺寸，比如hd720表示1280x720
- 如果不设置此选项，默认会跟随输入图片的尺寸
-pix_fmt
- 设置像素格式
- 可以通过ffmpeg -pix_fmts查看FFmpeg支持的像素格式
- 如果不设置此选项，默认会跟随输入图片的像素格式
  - 比如可能是rgb24、rgba8、pal8等
  - 可以通过ffprobe查看某图片的像素格式，比如ffprobe in.png

YUV转其他图片格式

ffmpeg -s 512x512 -pix_fmt yuv420p -i in.yuv out.jpg

这里必须得设置YUV的尺寸（-s）、像素格式（-pix_fmt）
这就类似于：对pcm进行编码时，必须得设置采样率（-ar）、声道数（-ac）、采样格式（-f）

显示YUV

完整的YUV

可以通过ffplay显示YUV数据。

YUV中直接存储的是所有像素的颜色信息（可以理解为是图像的一种原始数据）
必须得设置YUV的尺寸（-s）、像素格式（-pix_fmt）才能正常显示
这就类似于：播放pcm时，必须得设置采样率（-ar）、声道数（-ac）、采样格式（-f）

ffplay -s 512x512 -pix_fmt yuv420p in.yuv

# 在ffplay中

# -s已经过期，建议改为：-video_size

# -pix_fmt已经过期，建议改为：-pixel_format

ffplay -video_size 512x512 -pixel_format yuv420p in.yuv

单个分量

可以使用过滤器（filter）显示其中的单个分量（r、g、b、y、u、v）。

# 只显示r分量

ffplay -vf extractplanes=r in.png

# 只显示g分量

ffplay -vf extractplanes=g in.png

# 只显示b分量

ffplay -vf extractplanes=b in.png

# 只显示y分量

ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=y in.yuv

# 只显示u分量

ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=u in.yuv

# 只显示v分量

ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=v in.yuv

-vf
- 设置视频过滤器
- 等价写法：-filter:v
extractplanes
- 抽取单个分量的内容到灰度视频流中

17_详解YUV的更多相关文章

详解YUV与RGB数据格式-2016.01.20
参考文献什么是I帧,P帧,B帧图文详解YUV420数据格式 RGB565 与 RGB888的相互转换最简单的基于FFmpeg的libswscale的示例(YUV转RGB)
详解YUV数据格式
我们在讲 FFmpeg 系列的时候,有提到 YUV 的.其中包括YUV播放器.简单的YUV格式介绍. 一.YUV简介 YUV,是一种颜色编码方法.常使用在各个影像处理元件中. YUV在对照片或影片编码 ...
【秒懂音视频开发】18_详解YUV
本文的主角是多媒体领域非常重要的一个概念:YUV. 简介 YUV,是一种颜色编码方法,跟RGB是同一个级别的概念,广泛应用于多媒体领域中. 也就是说,图像中每1个像素的颜色信息,除了可以用RGB的方式 ...
图像处理之基础---yuv420及其rgb，bayer, yuv, RGB的相互转换详解
YUV格式解析1(播放器——project2) 根据板卡api设计实现yuv420格式的视频播放器打开*.mp4;*.264类型的文件,实现其播放. 使用的视频格式是YUV420格式 YUV格式 ...
YUV视频格式详解（翻译自微软文档）
原文: https://docs.microsoft.com/en-us/previous-versions/aa904813(v=vs.80) YUV视频格式详解(翻译自微软文档)https://b ...
YUV详解
YUV格式解析2 又确认了一下H264的视频格式——H264支持4:2:0的连续或隔行视频的编码和解码 YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL).YUV主要用 ...
Raspiberry Camera详解+picamera库+Opencv控制
使用树莓派的摄像头,将树莓派自身提供的picamera的API数据转换为Python Oencv可用图像数据: # import the necessary packages from picamer ...
V4L2 API详解 <二> Camera详细设置【转】
转自:http://blog.sina.com.cn/s/blog_602f87700101bf36.html 作者: Sam (甄峰) sam_code@hotmail.com Camera的 ...
Raspberry Camera详解+picamera库+Opencv控制
使用树莓派的摄像头,将树莓派自身提供的picamera的API数据转换为Python Oencv可用图像数据: # import the necessary packages from picamer ...
JPEG图像压缩算法流程详解
JPEG图像压缩算法流程详解 JPEG代表Joint Photographic Experts Group(联合图像专家小组).此团队创立于1986年,1992年发布了JPEG的标准而在1994年获得 ...

随机推荐

在K8S中，集群可以做哪些优化？
在Kubernetes(简称K8s)集群中,可以进行多种优化以提升性能.稳定性和资源利用率.以下是一些常见的优化措施: 控制面组件优化: kube-apiserver 高可用与扩展:通过配置多个API ...
Go语言的100个错误使用场景（21-29）｜数据类型
目录前言 3. Data types 3.5 低效的切片初始化(#21) 3.6 切片为 nil 与为空混淆(#22) 3.7 没有正确检查切片是否为空(#23) 3.8 错误的切片拷贝(#24) ...
Android Graphics 显示系统 - 如何模拟多(物理)显示屏？
" 本着花小钱办大事,不花钱也办事的原则,为了避免花钱买设备,那如何更便捷地学习/测试Android多屏显示的内容呢?本文就给大家介绍一种模拟Android多个物理屏幕显示的方法." ...
简单总结Tomcat/SpringMVC/Spring/SpringBoot的关系
Tomcat是一个Web应用服务器,可以作为Servlet容器.它的作用是,解析客户端client发起的request,并组装出HttpRequest.创建HttpResponse,将二者交于内部的H ...
Socket.D 开源输传协议的集群转发特性
1.简介 Socket.D 是基于"事件"和"语义消息""流"的网络应用层协议.底层可以依赖 TCP.UDP.KCP.WebSocket 等 ...
NC16417 [NOIP2017]奶酪
题目链接题目题目描述现有一块大奶酪,它的高度为 h,它的长度和宽度我们可以认为是无限大的,奶酪中间有许多半径相同的球形空洞.我们可以在这块奶酪中建立空间坐标系, 在坐标系中,奶酪的下表面为 z ...
sensitive-word 敏感词/脏词开源工具-v.0.10.0-脏词分类标签支持
sensitive-word sensitive-word 基于 DFA 算法实现的高性能敏感词工具. 创作目的实现一款好用敏感词工具. 基于 DFA 算法实现,目前敏感词库内容收录 6W+(源文件 ...
Java容器及其常用方法汇总
1 概述 Java Collections 框架中包含了大量的接口及其实现类和操作它们的算法,主要包括列表(List).集合(Set).映射(Map),如下: 接口实现类数据结构初始容量加载因 ...
细说 QUEST CENTRAL FOR DB2 八宗罪
作为一个从事oracle plsql开发2年的程序员,如今跳槽从事DB2数据仓库项目. 以PL/SQL Developer为参考,以下简称PLSQL,细说QUEST CENTRAL FOR DB2 5 ...
cf思维题
1.B. Paranoid String 题意:操作一:01可以变成1,操作二:10可以变成0.给定一个串,判断字串经过若干次操作,能否长度变成1,统计数量. 思路:对01来说,1可以吃掉0,然后前边 ...

17_详解YUV

简介

vs RGB

体积更小

组成

兼容性

转换

公式1

公式2

公式3

色度二次采样

原理

概念

采样格式

4:4:4

4:2:2

4:2:0

存储格式

分类

4:4:4

Planar

Semi-Planar

4:2:2

Planar

Semi-Planar

Packed

4:2:0

Planar

Semi-Planar

格式转换

其他图片格式转YUV

YUV转其他图片格式

显示YUV

完整的YUV

单个分量

17_详解YUV的更多相关文章

随机推荐

热门专题