基于opencv+ffmpeg的镜头分割

镜头分割常常被用于视频智能剪辑、视频关键帧提取等场景。

本文给出一种解决镜头分割问题的思路，可分为两个步骤：

1、根据镜头分割算法对视频进行分割标记

核心在于镜头分割算法，这里简单描述一种算法思路：ratio = different(current_frame_histogram, prevous_frame_histogram) / avgvere_different(previous_frame_histogram)，通过大量试验找到合适的ratio 阈值，若ratio大于阈值，则从当前帧分割视频，由于版权原因本文省略具体算法及实现。利用cv2的calcHist计算帧RGB三通道histogram的代码如下：

    for id in range(3):

        self.current_hist_rgb[id] = cv2.calcHist([frame], [0], None, [256], [0, 255])

2、根据分割标记进行实际分割

本文使用ffmpeg进行视频分割（需安装ffmpeg），具体命令如下

ffmpeg -ss starttime -i input.mp4 -t duration -codec copy -codec copy output.mp4 -y

命令中参数的顺序不能任意调整，-ss必须是第一个参数，否则分割后的视频可能出现黑屏，-t参数必须在-i参数后面，否则分割后视频可能出现时长不正确的问题。从实际效果来看，分割点并不准确在-ss参数指定的时间点，而是之前最近的关键帧。

最后，本文采用ffmpeg-python(需要用pip安装)来计算视频pts，具体实现见VideoCutEngine的calcPTS方法。

实现代码：

import cv2

import ffmpeg

import numpy as np

import sys

import os

class VideoCutEngine():

    def __init__(self, input):

        self.input = input

    def calcPTS(self):

        try:

            probe = ffmpeg.probe(self.input)

        except ffmpeg.Error as e:

            print(e.stderr, sys.stderr)

            return False, 0

        video_stream = next((stream for stream in probe['streams'] if stream['codec_type'] == 'video'), None)

        if video_stream is None:

            return False, 1

        num_frames = int(video_stream['nb_frames'])

        duration = float(video_stream['duration'])

        return True, num_frames * 1.0 / duration

    def doCut(self, start, duration, output):

        cmd = 'ffmpeg -ss {} -i {} -t {} -codec copy -codec copy {} -y'.format(start, self.input, duration, output)

        ret = os.system(cmd)

        return ret

class SceneSplitEngine():

    def __init__(self):

        self.frame = None

        self.current_hist_rgb = [0, 0, 0]

        self.last_hist_rgb = [0, 0, 0]

        self.frame_count = 0

        self.current_shot_count = 0

        self.hist_diff = []

    def setFrmae(self,frame):

        self.frame = frame

        self.frame_count += 1

        self.current_shot_count += 1

    def doSplit(self):

        for id in range(3):

            self.current_hist_rgb[id] = cv2.calcHist([frame], [0], None, [256], [0, 255])

        具体算法实现省略。

input = '/data/test.mp4'

if __name__ == '__main__':

    sceneSpliter = SceneSplitEngine()

    videoCutter = VideoCutEngine(input)

    videoCapturer = cv2.VideoCapture(input)

    pts = videoCutter.calcPTS()

    while True:

        ret1, frame = videoCapturer.read()

        if ret1 == True:

            sceneSpliter.setFrmae(frame)

            ret2, start, end = sceneSpliter.doSplit()

            if ret2 == True:

                duration = max((end -start) / 24, 1)

                print(ret2, start / 24, duration)

                output = '/data/output{}.mp4'.format(start / 24)

                videoCutter.doCut(start / 24, duration, output)

        else:

            break

基于opencv+ffmpeg的镜头分割的更多相关文章

Android上掌纹识别第一步：基于OpenCV的6种肤色分割源码和效果图
Android上掌纹识别第一步:基于OpenCV的6种肤色分割源码和效果图分类: OpenCV图像处理2013-02-21 21:35 6459人阅读评论(8) 收藏举报原文链接 ht ...
Java基于opencv实现图像数字识别(五)—投影法分割字符
Java基于opencv实现图像数字识别(五)-投影法分割字符水平投影法 1.水平投影法就是先用一个数组统计出图像每行黑色像素点的个数(二值化的图像): 2.选出一个最优的阀值,根据比这个阀值大或小 ...
语义分割：基于openCV和深度学习（二）
语义分割:基于openCV和深度学习(二) Semantic segmentation in images with OpenCV 开始吧-打开segment.py归档并插入以下代码: Semanti ...
语义分割：基于openCV和深度学习（一）
语义分割:基于openCV和深度学习(一) Semantic segmentation with OpenCV and deep learning 介绍如何使用OpenCV.深度学习和ENet架构执行 ...
基于OpenCV制作道路车辆计数应用程序
基于OpenCV制作道路车辆计数应用程序发展前景随着科学技术的进步和工业的发展,城市中交通量激增,原始的交通方式已不能满足要求:同时,由于工业发展为城市交通提供的各种交通工具越来越多,从而加速了城 ...
Java基于opencv实现图像数字识别(二)—基本流程
Java基于opencv实现图像数字识别(二)-基本流程做一个项目之前呢,我们应该有一个总体把握,或者是进度条:来一步步的督促着我们来完成这个项目,在我们正式开始前呢,我们先讨论下流程. 我做的主要 ...
基于OpenCv和swing的图片/视频展示Java实现
基于OpenCv和swing实现图片/视频的展示图片的展示 swing展示图片,多为操作BufferedImage,这里要关注的核心是将Mat转为BufferedImage. 代码如下: publi ...
Java基于opencv实现图像数字识别(一)
Java基于opencv实现图像数字识别(一) 最近分到了一个任务,要做数字识别,我分配到的任务是把数字一个个的分开:当时一脸懵逼,直接百度java如何分割图片中的数字,然后就百度到了用Buffere ...
c++开发ocx入门实践三--基于opencv的简易视频播发器ocx
原文:http://blog.csdn.net/yhhyhhyhhyhh/article/details/51404649 利用opencv做了个简易的视频播放器的ocx,可以在c++/c#/web ...

随机推荐

centos7下安装jdk7
CentOS7.1 JDK安装 1.卸载自带OPENJDK 用 java -version 命令查看当前jdk版本信息 #java -version 用rpm -qa | grep ...
Myeclipse 快捷键使用
MyEclipse快捷键大全-------------------------------------MyEclipse 快捷键1(CTRL)----------------------------- ...
未能将网站配置为使用ASP.NET4.X 解决方法
WIN 10系统安装Visual Studio 2012新建ASP.NET MVC 4 WEB 应用程序出错有些图片是网上截取而来,之前光顾着处理问题而忘记截图了,提示的ASP.net 版本有些不同 ...
基于docker环境，搭建 jetty环境，部署java项目
前提: 1.Ubuntu 系统. 2.docker环境已经安装好. 实现步骤: 1.上docker hub 下载jetty docker 镜像. 执行命令:$ sudo docker pull jet ...
SpringCloud-路由网关(Zuul)
在微服务架构中,需要几个基础的服务治理组件,包括服务注册与发现.服务消费.负载均衡.断路器.只能路由.配置管理等,由这几个基础组件相互协作,共同组建了一个简单的微服务系统. 在Spring Cloud ...
Codeforces Round #275 (Div. 2) D
题意 : 一个数组给出m个限制条件 l r z 代表从l 一直 & 到 r 为 z 问能否构造出这种数组如果可以构造出来因为 n m 都是1e5 而l r 可能输入进去就超时了所以 ...
Java -- 利用反射操作任意数组，包括对象数组和基本数据类型的数组
items为任意数组
Log4j2的日志配置文件，log4j2.xml文件的配置（实现控制台输出，各级别分别文件输出，自动压缩等）
<?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE html PUBLIC "-//W ...
Java 创建线程的两种方法
Java提供了线程类Thread来创建多线程的程序.其实,创建线程与创建普通的类的对象的操作是一样的,而线程就是Thread类或其子类的实例对象.每个Thread对象描述了一个单独的线程.要产生一个线 ...
CentOS 6和CentOS 7命令区别
From http://www.cnblogs.com/bethal/p/5945026.html (1)桌面系统[CentOS6] GNOME 2.x[CentOS7] GNOME 3.x(G ...

基于opencv+ffmpeg的镜头分割

基于opencv+ffmpeg的镜头分割的更多相关文章

随机推荐

热门专题