新手学习FFmpeg - 调用API完成录屏

调用FFMPEG Device API完成Mac录屏功能。

调用FFMPEG提供的API来完成录屏功能，大致的思路是:

打开输入设备.
打开输出设备.
从输入设备读取视频流，然后经过解码->编码，写入到输出设备.

+--------------------------------------------------------------+

|   +---------+    decode               +------------+         |

|   | Input   | ----------read -------->|  Output    |         |

|   +---------+                 encode  +------------+         |

+--------------------------------------------------------------+

因此主要使用的API就是:

avformat_open_input
avcodec_find_decoder
av_read_frame
avcodec_send_packet/avcodec_receive_frame
avcodec_send_frame/avcodec_receive_packet

打开输入设备

如果使用FFmpeg提供的-list_devices 命令可以查询到当前支持的设备，其中分为两类:

AVFoundation video devices
AVFoundation audio devices

AVFoundation 是Mac特有的基于时间的多媒体处理框架。本次是演示录屏功能，因此忽略掉audio设备，只考虑video设备。在avfoundation.m文件中没有发现可以程序化读取设备的API。FFmpeg官方也说明没有程序化读取设备的方式，通用方案是解析日志来获取设备(https://trac.ffmpeg.org/wiki/DirectShow#Howtoprogrammaticallyenumeratedevices)，下一篇再研究如何通过日志获取当前支持的设备，本次就直接写死设备ID。

获取指定格式的输入设备

    pAVInputFormat = av_find_input_format("avfoundation");

通过指定格式名称获取到AVInputFormat结构体。

打开设备

    value = avformat_open_input(&pAVFormatContext, "1", pAVInputFormat, &options);

    if (value != 0) {

        cout << "\nerror in opening input device";

        exit(1);

    }

"1"指代的是设备ID。 options是打开设备时输入参数，

    // 记录鼠标

    value = av_dict_set(&options, "capture_cursor", "1", 0);

    if (value < 0) {

        cout << "\nerror in setting capture_cursor values";

        exit(1);

    }

    // 记录鼠标点击事件

    value = av_dict_set(&options, "capture_mouse_clicks", "1", 0);

    if (value < 0) {

        cout << "\nerror in setting capture_mouse_clicks values";

        exit(1);

    }

    // 指定像素格式

    value = av_dict_set(&options, "pixel_format", "yuyv422", 0);

    if (value < 0) {

        cout << "\nerror in setting pixel_format values";

        exit(1);

    }

通过value值判断设备是否正确打开。然后获取设备视频流ID(解码数据包时需要判断是否一致)，再获取输入编码器(解码时需要)。

打开输出设备

假设需要将从输入设备读取的数据保存成mp4格式的文件。

将视频流保存到文件中，只需要一个合适的编码器(用于生成符合MP4容器规范的帧)既可。获取编码器大致分为两个步骤:

构建编码器上下文(AVFormatContext)
匹配合适的编码器(AVCodec)

构建编码器:

    // 根据output_file后缀名推测合适的编码器

    avformat_alloc_output_context2(&outAVFormatContext, NULL, NULL, output_file);

    if (!outAVFormatContext) {

        cout << "\nerror in allocating av format output context";

        exit(1);

    }

匹配编码器:

    output_format = av_guess_format(NULL, output_file, NULL);

    if (!output_format) {

        cout << "\nerror in guessing the video format. try with correct format";

        exit(1);

    }

    video_st = avformat_new_stream(outAVFormatContext, NULL);

    if (!video_st) {

        cout << "\nerror in creating a av format new stream";

        exit(1);

    }

编解码

从输入设备读取的是原生的数据流，也就是经过设备编码之后的数据。需要先将原生数据进行解码，变成程序可读的数据，在编码成输出设备可识别的数据。所以这一步的流程是：

解码输入设备数据
转码
编码写入输出设备

通过av_read_frame从输入设备读取数据:

while (av_read_frame(pAVFormatContext, pAVPacket) >= 0) {

    ...

}

对读取后的数据进行拆包，找到我们所感兴趣的数据

    // 最开始没有做这种判断，出现不可预期的错误。 在官网example中找到这句判断，但还不是很清楚其意义。应该和packet封装格式有关

    pAVPacket->stream_index == VideoStreamIndx

从FFmpeg 4.1开始，有了新的编解码函数。为了长远考虑，直接使用新API。使用avcodec_send_packet将输入设备的数据发往解码器进行解码，然后使用avcodec_receive_frame从解码器接受解码之后的数据帧。代码大概是下面的样子:

            value = avcodec_send_packet(pAVCodecContext, pAVPacket);

            if (value < 0) {

                fprintf(stderr, "Error sending a packet for decoding\n");

                exit(1);

            }

            while(1){

                value = avcodec_receive_frame(pAVCodecContext, pAVFrame);

                if (value == AVERROR(EAGAIN) || value == AVERROR_EOF) {

                    break;

                } else if (value < 0) {

                    fprintf(stderr, "Error during decoding\n");

                    exit(1);

                }

                .... do something

            }

读取到数据帧后，就可以对每一帧进行转码:

    sws_scale(swsCtx_, pAVFrame->data, pAVFrame->linesize, 0, pAVCodecContext->height, outFrame->data,outFrame->linesize);

最后将转码后的帧封装成输出设备可设别的数据包格式。也就是解码的逆动作，使用avcodec_send_frame将每帧发往编码器进行编码，通过avcodec_receive_packet一直接受编码之后的数据包。处理逻辑大致是:

                value = avcodec_send_frame(outAVCodecContext, outFrame);

                if (value < 0) {

                    fprintf(stderr, "Error sending a frame for encoding\n");

                    exit(1);

                }

                while (value >= 0) {

                    value = avcodec_receive_packet(outAVCodecContext, &outPacket);

                    if (value == AVERROR(EAGAIN) || value == AVERROR_EOF) {

                        break;

                    } else if (value < 0) {

                        fprintf(stderr, "Error during encoding\n");

                        exit(1);

                    }

                    ... do something;

                    av_packet_unref(&outPacket);

                }

以后就按照这种的处理逻辑，不停的从输入设备读取数据，然后经过解码->转码->编码，最后发送到输出设备。这样就完成了录屏功能。

上面是大致处理思路，完整源代码可以参考 (https://github.com/andy-zhangtao/ffmpeg-examples/tree/master/ScreenRecord) .

新手学习FFmpeg - 调用API完成录屏的更多相关文章

新手学习FFmpeg - 调用API完成录屏并进行H.264编码
Screen Record H.264 目前在网络传输视频/音频流都一般会采用H.264进行编码,所以尝试调用FFMPEG API完成Mac录屏功能,同时编码为H.264格式. 在上一篇文章中,通过调 ...
新手学习FFmpeg - 调用API编写实现多次淡入淡出效果的滤镜
前面几篇文章聊了聊FFmpeg的基础知识,我也是接触FFmpeg不久,除了时间处理之外,很多高深(滤镜)操作都没接触到.在学习时间处理的时候,都是通过在ffmpeg目前提供的avfilter基础上面修 ...
新手学习FFmpeg - 调用API完成视频的读取和输出
在写了几个avfilter之后,原本以为对ffmpeg应该算是入门了. 结果今天想对一个视频文件进行转码操作,才发现基本的视频读取,输出都搞不定. 痛定思痛,仔细研究了一下ffmpeg提供的examp ...
新手学习FFmpeg - 调用API完成两个视频的任意合并
本次尝试在视频A中的任意位置插入视频B. 在上一篇中,我们通过调整PTS可以实现视频的加减速.这只是对同一个视频的调转,本次我们尝试对多个视频进行合并处理. Concat如何运行 ffmpeg提供了一 ...
新手学习FFmpeg - 调用API计算关键帧渲染时间点
通过简单的计算来,线上I帧在视频中出现的时间点. 完整代码请参考 https://andy-zhangtao.github.io/ffmpeg-examples/ 名词解释首先需要明确以下名词概念: ...
新手学习FFmpeg - 调用API调整视频局部速率
通过修改setpts代码实现调整视频部分的播放速率. 完整代码可参考: https://andy-zhangtao.github.io/ffmpeg-examples/ 在前面提到了PTS/DTS/T ...
新手学习FFmpeg - 通过API实现可控的Filter调用链
虽然通过声明[x][y]avfilter=a=x:b=y;avfilter=xxx的方式可以创建一个可用的Filter调用链,并且在绝大多数场合下这种方式都是靠谱和实用的. 但如果想精细化的管理AVF ...
新手学习FFmpeg - 通过API完成filter-complex功能
本篇尝试通过API实现Filter Graph功能. 源码请参看 https://andy-zhangtao.github.io/ffmpeg-examples/ FFmpeg提供了很多实用且强大的滤 ...
android 调用 screenrecord 实现录屏
首先要说明的是并未实现,本文讲一下自己的思路. adb 使用shell 命令 screenrecord 可录屏. 自己写了个app,通过Process p = Runtime.getRuntime() ...

随机推荐

小白开学Asp.Net Core《二》（补）
小白开学Asp.Net Core<二>(补) ——数据仓储层(Repositroy).服务层(Service) -------------------------------------- ...
【ML入门】李宏毅机器学习笔记01-Learning Map
版权声明:小博主水平有限,希望大家多多指导.本文仅代表作者本人观点,转载请联系知乎原作者——BG大龍. 目录 1 什么是机器学习? 2 机器学习的3个步骤 3 李宏毅老师的机器学习课程 4 按“模型的 ...
PHPStrom激活方法【亲测有效2018.4.23】
直接用浏览器打开 http://idea.lanyus.com/ 点击页面中的"获得注册码", 然后在注册时切换至Activation Code选项,输入获得的注册码一长串字符串 ...
PHP中的$_POST变量
定义在 PHP 中,预定义的 $_POST 变量用于收集来自 method="post" 的表单中的值. $_POST 变量预定义的 $_POST 变量用于收集来自method ...
如何在 Centos7 中安装 Mysql 5.7
一.下载安装包 (1). 下载MySQL源码 (进入/usr/local/src目录,使用wget下载) cd /usr/local/src wget https://dev.mysql.com/ge ...
第一章：初识Java
计算机程序:计算机为完成某些功能产生的一系列有序指令集合. Java技术包括:JavaSE(标准版) JavaEE(企业版) ---JavaME(移动版) 开发Java程序步骤:1.编写 2.编译 3 ...
Android CountDownTimer 类实现倒计时
本文用 Android 中的 CountDownTimer 类实现倒计时功能,类似输入手机号获得验证码.界面如下所示: 1. 点击 “开始计时” 按钮后开始进行倒计时, 2. 倒计时过程: 3. 时间 ...
BeanFactory体系结构
BeanFactory是Spring中非常重要的一个类,搞懂了它,你就知道了bean的初始化和摧毁过程,对于深入理解IOC有很大的帮助. BeanFactory体系结构首先看一下使用IDEA生成的继 ...
Java 设置PDF文档浏览偏好
在查看PDF文档时,可进行一些浏览偏好设置,例如是否全屏浏览.隐藏或显示菜单栏/工具栏.设置页面布局模式等,下面将通过Java编程的方式来演示如何设置. 使用工具: Free Spire.PDF fo ...
react解析: render的FiberRoot(三)
react解析: render的FiberRoot(三) 感谢 yck: 剖析 React 源码解析,本篇文章是在读完他的文章的基础上,将他的文章进行拆解和加工,加入我自己的一下理解和例子,便于大家理 ...

新手学习FFmpeg - 调用API完成录屏

新手学习FFmpeg - 调用API完成录屏的更多相关文章

随机推荐

热门专题