基于加权平滑过渡的无缝拼接

背景

在做照片数字人视频生成的时候，为了达到快速响应实时播放的需求，即视频的生成速度必须小于音频的播放速度。

因此，我们截取了一部分较小的可动区域进行推理生成，然后把生成的图像贴回到原区域。

通常情况下，推理生成图像的清晰度和色彩对比原图有些许差异，这样导致贴图后的图像区域有明显的边界感和分割感。如下图所示：

方案选取

最开始我们想到 cv2.seamlessClone 贴回原区域后效果非常不错，能有效的消除边界，但是有个致命缺陷：不支持GPU加速，单帧的处理速度超过40ms。

也试过其他的机器学习融合算法，他们都有速度慢的缺陷。

因此，为了能达到最快的单帧处理速度，我们采用最为朴素的加权平滑过渡方案，并且把运算放在GPU中。

实现

加权平滑过渡，越靠近边缘底图的权重越高；越靠近中心贴图的权重越高。可以设计这样一个mask矩阵，权重从边缘到中心平滑过渡，贴图的时候直接相乘即可。

# h:高，w:宽，d:过渡距离

def create_mask(h, w, d):

    mask = torch.full((h,w),fill_value=1.0)

    step = 1.0 / d

    range_1 = torch.arange(0, 1, step)[0:d].reshape(1, d)

    range_2 = torch.reshape(range_1, (d, 1))

    range_3 = torch.fliplr(range_1)

    range_4 = torch.flipud(range_2)

    mask[:h, :d] *= range_1 # left

    mask[:d, :w] *= range_2 # top

    mask[:h, w-d:w] *= range_3 # right

    mask[h-d:h, :w] *= range_4  # bottom

    return mask

后续实现

import time

import cv2

import torch

import numpy as np

import matplotlib.pyplot as plt

center_x = 382

center_y = 333

# 贴图坐标和宽高

x = int(382-(698/2))

y = int(333-(667/2))

r_w = 698

r_h = 667

# 原图

full = cv2.imread("9638fa56.png")

full = cv2.cvtColor(full, cv2.COLOR_BGR2RGB)

full = np.transpose(full, [2, 0, 1]).astype(np.float16) # h w c -> c h w

full = torch.from_numpy(full).to('cuda')

# 贴图区域

copy_area = full[:,y:r_h+y,x:r_w+x]

print('copy_area', copy_area.shape)

# 贴图

head = np.load('head.npy')

head = cv2.resize(head, (r_w, r_h))

head = np.transpose(head, [2, 0, 1]).astype(np.float16) # h w c -> c h w

head = torch.from_numpy(head).to('cuda')

print('head', head.shape)

# mask矩阵

h = head.shape[1]

w = head.shape[2]

d = int( w / 9 )

mask_head = create_mask(h, w, d).to('cuda')

mask_src = 1-mask_head

# 加权融合

t0 = time.time()

mix = None

for idx in range(1):

    head[0,:,:] *= mask_head

    head[1,:,:] *= mask_head

    head[2,:,:] *= mask_head

    copy_area[0,:,:] *= mask_src

    copy_area[1,:,:] *= mask_src

    copy_area[2,:,:] *= mask_src

    mix = head + copy_area

print('cost=', (time.time()-t0))

# 贴回原区域

full[:,y:r_h+y,x:r_w+x] = mix

full = np.transpose(full.data.cpu().numpy().astype(np.uint8), [1, 2, 0])

plt.imshow(full)

效果图

结论

加权平滑过渡的无缝拼接，能很好的消除贴图的边界和分割，并且单帧的处理速度在0.15ms左右（V100），满足实时数字人的生成需求。

缺陷

肩部水平位移过大时，拼接会出现明显的分割和重影。解决方法：通过计算光流或者图像模式匹配得出运动位移，然后对位移区域进行形变，可以缓解。

Pytorch 基于加权平滑过渡的无缝拼接的更多相关文章

基于 IJKPlayer-concat 协议的视频无缝拼接技术实现
一.前言 Hi,大家好,我是承香墨影! 开门见山,开篇名义.今天来聊聊如何将多段视频,拼接成一个完整而连续的视频,然后无缝进行播放. 这样的需求应该不算偏门吧? 最简单的就是一些视频 App,会将大段 ...
平滑过渡的战争迷雾(一) 原理：Warcraft3地形拼接算法
本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9611887 作者:七十一雾央新浪微博:http:/ ...
《C++游戏开发》笔记十三平滑过渡的战争迷雾(一) 原理：Warcraft3地形拼接算法
本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9611887 作者:七十一雾央新浪微博:http:/ ...
Android实现真正的ViewPager【平滑过渡】+【循环滚动】！！！顺带还有【末页跳转】。
实现真正的ViewPager[平滑过渡]+[循环滚动]!!!顺带还有[末页跳转]. 首先呢, 我要对网上常见的3种ViewPager的循环滚动方法做个概述.急需看真正实现方法的同志请选择性忽略下面这一 ...
Opencv Sift和Surf特征实现图像无缝拼接生成全景图像
Sift和Surf算法实现两幅图像拼接的过程是一样的,主要分为4大部分: 1. 特征点提取和描述 2. 特征点配对,找到两幅图像中匹配点的位置 3. 通过配对点,生成变换矩阵,并对图像1应用变换矩阵生 ...
Unity3d Material(材质) 无缝拼接
Unity3d Material(材质) Edit by @灰太龙在做一个项目的过程中,遇到动态切换壁纸的功能,问题点在无缝拼接! 那我们先查查Unity3d 中的材质球,里面有个参数 Tiling ...
js实现网页全屏切换（平滑过渡），鼠标滚动切换
实现效果为页面平滑过渡全屏切换,点击导航和鼠标滚动都可以切换. 效果图: html代码: <!DOCTYPE html> <html> <head lang=" ...
关于图片无缝拼接的学习(PTGui)
一.简介在用到单反.无人机.手机等拍照工具,需要无缝拼接. 二.下载官网:http://www.ptgui.com/download.html 其他:http://pan.baidu.com/sh ...
【转】Android循环滚动广告条的完美实现，封装方便，平滑过渡，从网络加载图片，点击广告进入对应网址
Android循环滚动广告条的完美实现,封装方便,平滑过渡,从网络加载图片,点击广告进入对应网址关注finddreams,一起分享,一起进步: http://blog.csdn.net/finddr ...
MyBatis3与Spring3无缝集成-从iBatis平滑过渡
从2010开始接触iBatis到现在,一直到现在把iBatis作为数据访问层ORM.为了演示一个Web应用,今天又搭了个SpringMVC应用,由于应用比较简单,Spring版本直接用最新版本3.2. ...

随机推荐

Fiddler关于https抓包
一.Fiddler默认只抓取HTTP请求 Fiddler安装后默认只抓取HTTP请求,如要抓取HTTPS请求需要进行证书安装二.Fiddler导出HTTPS证书 1.勾选HTTPS 工具栏Tools ...
8、SpringMVC之RESTful案例
阅读本文前,需要先阅读SpringMVC之RESTful概述 8.1.前期工作 8.1.1.创建实体类Employee package org.rain.pojo; import java.io.Se ...
【C】Re08 内存
一.概述程序运行之后,所有的数据加载到内存上内存会被操作系统进行分区处理, 划分的区域主要分为4个: [1.代码文本区 text] 存放开发者编写的代码文本,二进制内容形式 [2.静态全局区 St ...
大模型时代该用什么样的显卡 —— 实验室新进两块A800显卡
具体如图: (这两个显卡是专为实验室的大模型方向提供的) 关于A800显卡的性能参数: (上图源自:https://www.zhihu.com/question/618932114/answer/32 ...
连接huggingface.co报错：(MaxRetryError("SOCKSHTTPSConnectionPool(host='huggingface.co', port=443) (SSLEOFError(8, '[SSL: UNEXPECTED_EOF_WHILE_READING] EOF occurred in violation of protocol (_ssl.c:1007)
参考: https://blog.csdn.net/shizheng_Li/article/details/132942548 https://blog.csdn.net/weixin_4220944 ...
记录一次实验室linux系统的GPU服务器死机排查过程——某显卡满负荷导致内核进程超时导致系统死机
在自己没有管理多台高负荷的ubuntu显卡服务器之前,我是万万想不到linux服务器居然也是如此容易死机的. 什么每个版本的TensorFlow调用显卡驱动时和内核不兼容,什么系统自动升级导致的显卡驱 ...
Jenkins部署架构概述
1.Jenkins是什么 Jenkins是一个开源的.提供友好操作界面的持续集成(CI)工具,起源于Hudson,主要用于持续.自动的构建/测试软件项目.监控外部任务的运行. Jenkins用Java ...
20-canvas之形变
1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="U ...
1. 从0开始学ARM-安装Keil MDK uVision集成开发环境
关于ARM的一些基本概念,大家可以参考我之前的文章: <到底什么是Cortex.ARMv8.arm架构.ARM指令集.soc?一文帮你梳理基础概念[科普]> 0. 如何学习arm? ARM ...
How-many
#include <bits/stdc++.h> #include <termio.h> #include <unistd.h> typedef long long ...

Pytorch 基于加权平滑过渡的无缝拼接

基于加权平滑过渡的无缝拼接

背景

方案选取

实现

结论

缺陷

Pytorch 基于加权平滑过渡的无缝拼接的更多相关文章

随机推荐

热门专题