2023-04-12：使用 Go 重写 FFmpeg 的 extract_mvs.c 工具程序，提取视频中的运动矢量信息。

答案2023-04-12：

主要的过程包括：

打开输入视频文件并查找视频流信息。
根据视频流类型打开解码器，并设置解码器参数。
循环读取视频帧数据。
对每一帧数据进行解码并提取其中的运动矢量信息。
输出每个运动矢量的相关参数：帧号、来源、块大小、源位置、目标位置、标志等。

具体的过程实现在 main0 函数中，其中调用了 decode_packet 和 open_codec_context 函数来完成解码和上下文打开的过程。最终输出结果通过 fmt.Printf 函数打印到控制台上。

整个程序的主函数为 main，其中设置了 FFmpeg 库的路径和创建了一个 out 目录用于存放输出结果。

代码见moonfdd/ffmpeg-go库。

命令如下：

go run ./examples/internalexamples/extract_mvs/main.go ./resources/big_buck_bunny.mp4

golang代码如下：

package main

import (

	"fmt"

	"os"

	"unsafe"

	"github.com/moonfdd/ffmpeg-go/ffcommon"

	"github.com/moonfdd/ffmpeg-go/libavcodec"

	"github.com/moonfdd/ffmpeg-go/libavformat"

	"github.com/moonfdd/ffmpeg-go/libavutil"

)

func main0() (ret ffcommon.FInt) {

	var pkt libavformat.AVPacket

	if len(os.Args) != 2 {

		fmt.Printf("Usage: %s <input video>\n", os.Args[0])

		os.Exit(1)

	}

	src_filename = os.Args[1]

	if libavformat.AvformatOpenInput(&fmt_ctx, src_filename, nil, nil) < 0 {

		fmt.Printf("Could not open source file %s\n", src_filename)

		os.Exit(1)

	}

	if fmt_ctx.AvformatFindStreamInfo(nil) < 0 {

		fmt.Printf("Could not find stream information\n")

		os.Exit(1)

	}

	open_codec_context(fmt_ctx, libavutil.AVMEDIA_TYPE_VIDEO)

	fmt_ctx.AvDumpFormat(0, src_filename, 0)

	for {

		if video_stream == nil {

			fmt.Printf("Could not find video stream in the input, aborting\n")

			ret = 1

			break

		}

		frame = libavutil.AvFrameAlloc()

		if frame == nil {

			fmt.Printf("Could not allocate frame\n")

			ret = -libavutil.ENOMEM

			break

		}

		fmt.Printf("framenum,source,blockw,blockh,srcx,srcy,dstx,dsty,flags\n")

		/* read frames from the file */

		for fmt_ctx.AvReadFrame(&pkt) >= 0 {

			if pkt.StreamIndex == uint32(video_stream_idx) {

				ret = decode_packet(&pkt)

			}

			pkt.AvPacketUnref()

			if ret < 0 {

				break

			}

		}

		/* flush cached frames */

		decode_packet(nil)

		break

	}

	// end:

	libavcodec.AvcodecFreeContext(&video_dec_ctx)

	libavformat.AvformatCloseInput(&fmt_ctx)

	libavutil.AvFrameFree(&frame)

	if ret < 0 {

		return 1

	} else {

		return 0

	}

}

var fmt_ctx *libavformat.AVFormatContext

var video_dec_ctx *libavcodec.AVCodecContext

var video_stream *libavformat.AVStream

var src_filename string

var video_stream_idx ffcommon.FInt = -1

var frame *libavutil.AVFrame

var video_frame_count ffcommon.FInt

func decode_packet(pkt *libavcodec.AVPacket) ffcommon.FInt {

	ret := video_dec_ctx.AvcodecSendPacket(pkt)

	if ret < 0 {

		fmt.Printf("Error while sending a packet to the decoder: %s\n", libavutil.AvErr2str(ret))

		return ret

	}

	for ret >= 0 {

		ret = video_dec_ctx.AvcodecReceiveFrame(frame)

		if ret == -libavutil.EAGAIN || ret == libavutil.AVERROR_EOF {

			break

		} else if ret < 0 {

			fmt.Printf("Error while receiving a frame from the decoder: %s\n", libavutil.AvErr2str(ret))

			return ret

		}

		if ret >= 0 {

			var i ffcommon.FInt

			var sd *libavutil.AVFrameSideData

			video_frame_count++

			sd = frame.AvFrameGetSideData(libavutil.AV_FRAME_DATA_MOTION_VECTORS)

			if sd != nil {

				//const AVMotionVector

				// mvs := (*libavutil.AVMotionVector)(unsafe.Pointer(sd.Data))

				var a [2]libavutil.AVMotionVector

				len0 := uintptr(unsafe.Pointer(&a[1])) - uintptr(unsafe.Pointer(&a[0]))

				for i = 0; i < sd.Size/int32(len0); i++ {

					mv := (*libavutil.AVMotionVector)(unsafe.Pointer(uintptr(unsafe.Pointer(sd.Data)) + len0*uintptr(i)))

					fmt.Printf("%d,%2d,%2d,%2d,%4d,%4d,%4d,%4d,0x%d\n",

						video_frame_count, mv.Source,

						mv.W, mv.H, mv.SrcX, mv.SrcY,

						mv.DstX, mv.DstY, mv.Flags)

				}

			}

			frame.AvFrameUnref()

		}

	}

	return 0

}

func open_codec_context(fmt_ctx *libavformat.AVFormatContext, type0 libavutil.AVMediaType) ffcommon.FInt {

	var ret ffcommon.FInt

	var st *libavformat.AVStream

	var dec_ctx *libavcodec.AVCodecContext

	var dec *libavcodec.AVCodec

	var opts *libavutil.AVDictionary

	ret = fmt_ctx.AvFindBestStream(type0, -1, -1, &dec, 0)

	if ret < 0 {

		fmt.Printf("Could not find %s stream in input file '%s'\n",

			libavutil.AvGetMediaTypeString(type0), src_filename)

		return ret

	} else {

		stream_idx := ret

		st = fmt_ctx.GetStream(uint32(stream_idx))

		dec_ctx = dec.AvcodecAllocContext3()

		if dec_ctx == nil {

			fmt.Printf("Failed to allocate codec\n")

			return -libavutil.EINVAL

		}

		ret = dec_ctx.AvcodecParametersToContext(st.Codecpar)

		if ret < 0 {

			fmt.Printf("Failed to copy codec parameters to codec context\n")

			return ret

		}

		/* Init the video decoder */

		libavutil.AvDictSet(&opts, "flags2", "+export_mvs", 0)

		ret = dec_ctx.AvcodecOpen2(dec, &opts)

		if ret < 0 {

			fmt.Printf("Failed to open %s codec\n",

				libavutil.AvGetMediaTypeString(type0))

			return ret

		}

		video_stream_idx = stream_idx

		video_stream = fmt_ctx.GetStream(uint32(video_stream_idx))

		video_dec_ctx = dec_ctx

	}

	return 0

}

func main() {

	os.Setenv("Path", os.Getenv("Path")+";./lib")

	ffcommon.SetAvutilPath("./lib/avutil-56.dll")

	ffcommon.SetAvcodecPath("./lib/avcodec-58.dll")

	ffcommon.SetAvdevicePath("./lib/avdevice-58.dll")

	ffcommon.SetAvfilterPath("./lib/avfilter-7.dll")

	ffcommon.SetAvformatPath("./lib/avformat-58.dll")

	ffcommon.SetAvpostprocPath("./lib/postproc-55.dll")

	ffcommon.SetAvswresamplePath("./lib/swresample-3.dll")

	ffcommon.SetAvswscalePath("./lib/swscale-5.dll")

	genDir := "./out"

	_, err := os.Stat(genDir)

	if err != nil {

		if os.IsNotExist(err) {

			os.Mkdir(genDir, 0777) //  Everyone can read write and execute

		}

	}

	main0()

}

2023-04-12：使用 Go 重写 FFmpeg 的 extract_mvs.c 工具程序，提取视频中的运动矢量信息。的更多相关文章

FFMPEG，将字幕“烧进”MP4视频中
原文地址:http://blog.csdn.net/ufocode/article/details/75475539 由于mp4容器,不像MKV等容器有自己的字幕流. MKV这种容器的视频格式中,会带 ...
ffmpeg使用C语言sdk实现抽取视频中的视频数据
主要使用函数特征码:Start code 解码的一些视频参数,分辨率和帧率:SPS/PPS ffmpeg获取SPS/PPS:codec->extradata 实例 #include <s ...
java 时间格式化(2016.04.12 12:32:55)
输入的时间格式如:2016.04.12 12:32:55所示: 想要获取一定格式的日期,时间的方法 String startString = "2016.04.25 12:25:44&quo ...
Ubuntu 13.04/12.10安装Oracle 11gR2图文教程(转)
Ubuntu 13.04/12.10安装Oracle 11gR2图文教程原文标题:How to Install Oracle 11G R2 Enterprise Edition Database U ...
Ubuntu LTS 系统学习使用体会和实用工具软件汇总 6.04 8.04 10.04 12.04 14.04 16.04
Ubuntu LTS 系统学习体会和工具软件汇总 6.04 8.04 10.04 12.04 14.04 16.04 ubuntu入门必备pdf:http://download.csdn.net/de ...
FFmpeg简易播放器的实现-音视频同步
本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10284653.html 基于FFmpeg和SDL实现的简易视频播放器,主要分为读取视频文 ...
FFmpeg 向视频中添加文字
原文地址:http://www.cnblogs.com/wanggang123/p/6707985.html FFmpeg支持添加文字功能,具体如何将文字叠加到视频中的每一张图片,FFmpeg调用了文 ...
解惑：在Ubuntu18.04.2的idea上运行Scala支持的spark程序遇到的问题
解惑:在Ubuntu18.04.2的idea上运行Scala支持的spark程序遇到的问题一.前言最近在做一点小的实验,用到了Scala,spark这些东西,于是在Linux平台上来完成,结果一个 ...
最简单的基于FFmpeg的移动端例子：IOS 视频解码器-保存
===================================================== 最简单的基于FFmpeg的移动端例子系列文章列表: 最简单的基于FFmpeg的移动端例子:A ...
最简单的基于FFmpeg的移动端例子：IOS 视频转码器
===================================================== 最简单的基于FFmpeg的移动端例子系列文章列表: 最简单的基于FFmpeg的移动端例子:A ...

随机推荐

Python学习笔记W1
今天正式开始学习Python语言,学习方式观看教学视频,完成作业.视频共计28周,争取每天2天完成一周教学内容,共计56天,预计完成日期:2019-2-28. Owen写于2018-12-22 ...
Centos6、7修改主机名
centos6 1.临时修改 hostname node1 2.永久生效 , 修改/etc/sysconfig/network 文件 HOSTNAME=node1 3.修改 /etc/hosts文件 ...
WinUI（WASDK）使用ChatGPT和摄像头手势识别结合TTS让机器人更智能
前言之前写过一篇基于ML.NET的手部关键点分类的博客,可以根据图片进行手部的提取分类,于是我就将手势分类和摄像头数据结合,集成到了我开发的电子脑壳软件里. 电子脑壳是一个为稚晖君开源的桌面机器人E ...
ansible用authorized_key模块批量推送密钥到受控主机实现免密登录
一,ansible的authorized_key模块的用途用来配置密钥实现免密登录: ansible所在的主控机生成密钥后,如何把公钥上传到受控端? 当然可以用ssh-copy-id命令逐台手动处理 ...
AI来实现代码转换！Python转Java，Java转Go不在话下？
今天看到个有趣的网站,给大家分享一下. 该网站的功能很神奇,可以实现编程语言的转化.感觉在一些场景之下还是有点作用的,比如你原来跟我一样是做Java的,因为工作需要突然转Go.这个时候用你Java的经 ...
数据库中1NF，2NF，3NF的判别
参照:https://blog.csdn.net/qq_28888837/article/details/98733448 1NF:每一个都是最原子化. 2NF:找到主键后,每一个非主键对主键都是完 ...
4.0 SDK Workshop 纪实：一起体验多人、多屏幕共享新功能
在本月初,声网发布了 RTC Native SDK 4.0 版本.该版本提供了更高的开发灵活度,可明显提升实时场景开发效率,并让第三方插件开发更容易.上周六(8月20日),我们组织了一场小型的线下 W ...
使用chatgt(GPT-4)将过程式(的java代码)改成函数式(的elixir代码)
天啦噜太可怕了,之前我还嘲笑chatgpt不会小众语言来着. chatgt(GPT-4)在接收2次prompt后,把过程式(的java代码)改成了函数式(的elixir代码),给出的Elixir代码可 ...
Net DB Web多级缓存的实现
1.客户端缓存(浏览器缓存) HTTP有一套控制缓存的协议-RFC7234,其中最重要的就是cache-control这个相应报文头,服务器返回时,如果Response带上 cache-control ...
【Visual Leak Detector】在 QT 中使用 VLD（方式三）
说明使用 VLD 内存泄漏检测工具辅助开发时整理的学习笔记. 目录说明 1. 使用前的准备 2. 在 QT 中使用 VLD 2.1 复制 lib 库及头文件 2.2 在项目 .pro 文件中指明路 ...

2023-04-12：使用 Go 重写 FFmpeg 的 extract_mvs.c 工具程序，提取视频中的运动矢量信息。

2023-04-12：使用 Go 重写 FFmpeg 的 extract_mvs.c 工具程序，提取视频中的运动矢量信息。的更多相关文章

随机推荐

热门专题