FFmpeg 的sws_getContext函数、sws

FFmpeg里面的sws_scale库可以在一个函数里面同时实现：1.图像色彩空间转换；2.分辨率缩放；3.前后图像滤波处理。

其核心函数主要有三个：

// 初始化sws_scale
struct SwsContext *sws_getContext(int srcW, int srcH, enum AVPixelFormat srcFormat,
                                  int dstW, int dstH, enum AVPixelFormat dstFormat,
                                  int flags,
                                  SwsFilter *srcFilter, SwsFilter *dstFilter, const double *param);
参数int srcW, int srcH, enum AVPixelFormat srcFormat定义输入图像信息（寬、高、颜色空间（像素格式））
参数int dstW, int dstH, enum AVPixelFormat dstFormat定义输出图像信息寬、高、颜色空间（像素格式））。
参数int flags选择缩放算法（只有当输入输出图像大小不同时有效）
参数SwsFilter *srcFilter, SwsFilter *dstFilter分别定义输入/输出图像滤波器信息，如果不做前后图像滤波，输入NULL
参数const double *param定义特定缩放算法需要的参数(?)，默认为NULL
函数返回SwsContext结构体，定义了基本变换信息。
如果是对一个序列的所有帧做相同的处理，函数sws_getContext只需要调用一次就可以了。
sws_getContext(w, h, YV12, w, h, NV12, 0, NULL, NULL, NULL);      // YV12->NV12 色彩空间转换
sws_getContext(w, h, YV12, w/2, h/2, YV12, 0, NULL, NULL, NULL); // YV12图像缩小到原图1/4
sws_getContext(w, h, YV12, 2w, 2h, YN12, 0, NULL, NULL, NULL);    // YV12图像放大到原图4倍，并转换为NV12结构

// 做转换
int sws_scale(struct SwsContext *c,
              const uint8_t *const srcSlice[], const int srcStride[],
              int srcSliceY, int srcSliceH,
              uint8_t *const dst[], const int dstStride[]);
参数struct SwsContext *c，为上面sws_getContext函数返回值；
参数const uint8_t *const srcSlice[], const int srcStride[]定义输入图像信息（当前处理区域的每个通道数据指针，每个通道行字节数）
stride定义下一行的起始位置。stride和width不一定相同，这是因为：
1.由于数据帧存储的对齐，有可能会向每行后面增加一些填充字节这样 stride = width + N；
2.packet色彩空间下，每个像素几个通道数据混合在一起，例如RGB24，每个像素3字节连续存放，因此下一行的位置需要跳过3*width字节。
srcSlice和srcStride的维数相同，由srcFormat值来。
csp       维数        宽width      跨度stride      高
YUV420     3        w, w/2, w/2    s, s/2, s/2   h, h/2, h/2
YUYV       1        w, w/2, w/2   2s, 0, 0       h, h, h
NV12       2        w, w/2, w/2    s, s, 0       h, h/2
RGB24      1        w, w,   w     3s, 0, 0       h, 0, 0
参数int srcSliceY, int srcSliceH,定义在输入图像上处理区域，srcSliceY是起始位置，srcSliceH是处理多少行。如果srcSliceY=0，srcSliceH=height，表示一次性处理完整个图像。
这种设置是为了多线程并行，例如可以创建两个线程，第一个线程处理 [0, h/2-1]行，第二个线程处理 [h/2, h-1]行。并行处理加快速度。
参数uint8_t *const dst[], const int dstStride[]定义输出图像信息（输出的每个通道数据指针，每个通道行字节数）

// 释放sws_scale

void sws_freeContext(struct SwsContext *swsContext);

在网上没有看到有关SwsFilter的讨论，看FFMpeg代码，总结下面的分析结果。

sws_scale前后图像滤波都定义为归一化的2维或者1维图像卷积处理。每个滤波器有四个分量
typedef struct SwsFilter {
    SwsVector *lumH; // 亮度水平处理
    SwsVector *lumV; // 亮度垂直处理
    SwsVector *chrH; // 色度水平处理
    SwsVector *chrV; // 色度垂直处理
} SwsFilter;
一般都是2维水平和垂直按照相同的处理系数来滤波。

每个滤波器定义为：
typedef struct SwsVector {
    double *coeff;              // 滤波器系数
    int length;                 // 滤波器长度
} SwsVector;
一般滤波器具有归一化：length个coeff之和等于1;
             对称性：length一般为奇数，coeff以中心为轴左右对称。

sws_scale库里定义了3种初始滤波器。
1. 高斯模糊 Gaussian Blur
   SwsVector *sws_getGaussianVec(double variance, double quality);
   variance就是σ。quality=3.0。
   const int length = (int)(variance * quality + 0.5) | 1;
   double middle = (length - 1) * 0.5;
   for (i = 0; i < length; i++) {
       double dist = i - middle;
       vec->coeff[i] = exp(-dist * dist / (2 * variance * variance)) / sqrt(2 * variance * M_PI);
   }
   如后在归一化vec->coeff[i]。
    // 这个公式和标准高斯公式不一样，标准高斯函数公式如下
       vec->coeff[i] = exp(-dist * dist / (2 * variance * variance)) / (variance*sqrt(2 * M_PI));

下面是一些variance值计算出来的结果。
variance = 1.0 => length=3 0.2741 0.4519 0.2741
variance = 1.5 => length=5 0.1201 0.2339 0.2921 0.2339 0.1201
variance = 2.0 => length=7 0.0702 0.1311 0.1907 0.2161 0.1907 0.1311 0.0702
垂直方向滤波器length过大，不仅计算量增加，数据读取的带宽需求也增大，近似为读取length*frame_size数据。

2.锐化滤波器 Sharpen
    if (lumaSharpen != 0.0) {
        SwsVector *id = sws_getIdentityVec();
        sws_scaleVec(filter->lumH, -lumaSharpen); // 所有点矢量乘 -lumaSharpen
        sws_addVec(filter->lumH, id);              // 矢量加
    }
    coeff[i] = i==(length-1)/2 ? 1 - lumaSharpen*coeff[i] : - lumaSharpen*coeff[i];
    中心点设为1-lumaSharpen*coeff[i]，其他点设为 -lumaSharpen*coeff[i].
    一般情况两个矢量相加，以中心点对齐，左右两边分别相加，没有的值补0.
    {a1, a2, a3} + {b1, b2, b3, b4, b5} = {b1, a1+b1, a2+b3, a3+b4, b5}
如已经使用高斯模糊得到滤波器为：
length=5         0.1201 0.2339 0.2921 0.2339 0.1201
设lumaSharpen = 0.7; 结果为
length=5        -0.0841 -0.1637 0.7955 -0.1637 -0.0841

3.色度移动滤波器 ChromaShift
    if (chromaHShift != 0.0)
        sws_shiftVec(filter->chrH, (int)(chromaHShift + 0.5));
    函数sws_getShiftedVec(SwsVector *a, int shift) 左移矢量a;如果shift小于0,右移
    移动后矢量长度为 length = a->length + FFABS(shift) * 2;
    左移就是后面补 length - a->length个0
    右移就是前面补 length - a->length个0
例如chromaHShift = 1.3, shift = (int)(1.3+0.5) = 1;
移位后结果增加 |1|*2 = 2个; 正数左移后面补零
        a1, a2, a3, ... aN, 0.0000, 0.0000
例如chromaHShift = -3.1, shift = (int)(-3.1+0.5) = -2;
移位后结果增加 |-2|*2 = 4个; 负数左移前面补零
   0.0000 0.0000 0.0000 0.0000 a1 a2 a3 ... aN
这个滤波器将色度位置移动，有什么用处？？？

4. 设置初始滤波器的流程
SwsFilter *sws_getDefaultFilter(float lumaGBlur,    float chromaGBlur,
                                float lumaSharpen, float chromaSharpen,
                                float chromaHShift, float chromaVShift,
                                int verbose);
参数float lumaGBlur, float chromaGBlur分别设置亮度和色度的高斯模糊参数。一般亮度做模糊，色度不做。
参数float lumaSharpen, float chromaSharpen分别设置亮度和色度的锐化参数。做高斯模糊后，物体边缘也变得模糊，为了减少这种影响，调用锐化滤波。如果不做高斯模糊，没必要做锐化滤波。
参数float chromaHShift, float chromaVShift分别设置色度在水平和垂直两方向上的色彩位移，不明白是什么物理意义，还是固定为0.0的好。
参数int verbose是控制打印滤波器参数，设置为0。
在函数里面亮度滤波器的设置流程是：
a. 如果lumaGBlur不为0.0, 设置高斯滤波器；
b. 如果lumaSharpen不为0.0, 在高斯滤波器上叠加锐化滤波；
c. 归一化步骤2的滤波器，作为最终的滤波器参数。

也可以按照需要设置自己的滤波器，但是都是做1维或者2维的卷积操作，所有有些滤波器也设置不出来。
例如线性拉伸处理。 g = k*f+b. f,g分别为原始和处理后像素点值，k,b为标量参数值。

基于计算复杂度的考虑，滤波器放置在图像相对小的那一端，例如sws_scale做缩小处理，那么滤波器在后端；如果做放大处理，滤波器放前端（个人建议）。

FFmpeg 的sws_getContext函数、sws_scale函数的更多相关文章

FFmpeg: FFmepg中的sws_scale() 函数分析
FFmpeg中的 sws_scale() 函数主要是用来做视频像素格式和分辨率的转换,其优势在于:可以在同一个函数里实现:1.图像色彩空间转换, 2:分辨率缩放,3:前后图像滤波处理.不足之处在于:效 ...
ffmpeg的API函数用法：sws_scale函数的用法-具体应用
移植ffmpeg过程中,遇到swscale的用法问题,所以查到这篇文章.文章虽然已经过去很长时间,但是还有颇多可以借鉴之处.谢谢“咕咕钟. 转自:http://guguclock.blogspot.c ...
零基础学习视频解码之FFMpeg中比较重要的函数以及数据结构
http://www.cnblogs.com/tanlon/p/3879081.html 在正式开始解码练习前先了解下关于FFmpeg中比较重要的函数以及数据结构. 1. 数据结构: (1) AVF ...
解决QZ-SDK静态库libRPToolLib.a中avfoundation.o文件和kxMovie依赖的ffmpeg静态库libavdevice.a函数重复定义的问题
解决QZ-SDK静态库libRPToolLib.a中avfoundation.o文件和kxMovie依赖的ffmpeg静态库libavdevice.a函数重复定义的问题在原来项目中导入全志v3相机的 ...
[原]零基础学习视频解码之FFMpeg中比较重要的函数以及数据结构
在正式开始解码练习前先了解下关于FFmpeg中比较重要的函数以及数据结构. 1. 数据结构: (1) AVFormatContext AVFormatContext是一个贯穿始终的数据结构,很多函 ...
C++虚函数和函数指针一起使用
C++虚函数和函数指针一起使用,写起来有点麻烦. 下面贴出一份示例代码,可作参考.(需要支持C++11编译) #include <stdio.h> #include <list> ...
Oracle_SQL函数-分组函数
分组函数什么是分组函数分组函数作用于一组数据,并对一组数据返回一个值组函数类型:主要有6种 AVG - 平均 COUNT - 计数 MAX - 最大 MIN - 最小 SUM - 求和 STDD ...
Oracle_SQL函数-单行函数
SQL函数 SQL函数分类 SQL函数主要有两种,分为单行函数.多行函数单行函数:只对一行进行变换,每行返回一个结果.可以转换数据类型,可以嵌套参数可以是一列或一个值多行函数:多行函数,每次对一组 ...
12－返回指针的函数&&指向函数的指针
前言接下来我只讲指针的最常见用法,比如这一章的内容----返回指针的函数与指向函数的指针一.返回指针的函数指针也是C语言中的一种数据类型,因此一个函数的返回值肯定可以是指针类型的. 返回 ...
JavaScript 闭包系列二（匿名函数及函数的闭包）
一. 匿名函数 1. 函数的定义,可分为三种 1) 函数声明方式 function double(x) { return 2*x; } 2)Function构造函数,把参数列表和函数体都作为字 ...

随机推荐

Android 中通过切割图片创建人物行走动画
以前一直使用序列图片来实现动画效果,造成空间的极大浪费,所以想要尝试下切割图片来实现动画. 如图所示,是由66rpg纸娃娃系统生成的角色行走图.本程序必须实现将人物的整体图片切割后存入4x4的数组来动 ...
python高级-------python2.7教程学习【廖雪峰版】（四）
2017年6月9日17:57:55 任务: 看完高级部分笔记:1.掌握了Python的数据类型.语句和函数,基本上就可以编写出很多有用的程序了.2.在Python中,代码不是越多越好,而是越少越好. ...
python利用正则表达式提取字符串
前言正则表达式的基础知识就不说了,有兴趣的可以点击这里,提取一般分两种情况,一种是提取在文本中提取单个位置的字符串,另一种是提取连续多个位置的字符串.日志分析会遇到这种情况,下面我会分别讲一下对应的 ...
WebView中打开相机，文件选择器的问题和解决方法
近几年前端开发真是越来越火,H5页面开发的移动端页面甚至有夺我原生开发半壁江山的意思,忧伤忧伤.不过从实际情况考虑,H5一套代码到处跑的特性,我们的Android, IOS ...也就只能呵呵了.然而 ...
Protobuf 语法 - 史上最简教程
Protobuf 语法简明教程疯狂创客圈死磕Netty 亿级流量架构系列之12 [博客园总入口 ] 在protobuf中,协议是由一系列的消息组成的.因此最重要的就是定义通信时使用到的消息格式. ...
isinstance/issubclass/type的区别？
type() 判断某个对象是否是该类创建的,只看一层,如果是继承类,也不会考虑继承类的类型.. Issubclass() 判断该类是否是另一个类的派生类,也就是子类,参数为类. isinstance( ...
iOS应用公布Invalid Binary问题解决方式
上次公布一淘HD应用.头一天公布,第二天就上线,私下还在想.是不是苹果採用什么优化的解决方式了,导致审核速度加快了. 这两天公布新版.一直碰到Invaild Binary问题.才想明确,原来大家都被这 ...
【prometheus】学习第一篇——prometheus
前言: 说到监控方案,市面上开源的有很多,最常用的zabbix,深入使用zabbix以后,才知道zabbix设计团队有多厉害,简直是一个完美的监控告警方案.但是在针对docker的监控上还差点,需要自 ...
中国移动OnetNet云平台使用WIFI模块ESP8266 TCP透传模式传输数据流步骤
测试使用工具: WIFI模块型号:ESP8266 https://item.taobao.com/item.htm?spm=a1z10.1-c.w137712-175513579.2.btbD9X&a ...
数据库连接理解——JDBC
需求:数据库操作数据是:用户信息 1.连接数据库 JDBC Hibernate 2.操作数据库 c create r read u update d delete 3.关闭数据库连接 interf ...

FFmpeg 的sws_getContext函数 、sws_scale函数

FFmpeg 的sws_getContext函数 、sws_scale函数的更多相关文章

随机推荐

热门专题

FFmpeg 的sws_getContext函数、sws_scale函数

FFmpeg 的sws_getContext函数、sws_scale函数的更多相关文章