故事

我们拥有的“干净”图像，往往不是干净的。理想的干净图像是从成像传感器上获取的，然而我们看到的图像还经过了相机内部的处理流程。该过程包含量化、去马赛克、伽马校正、压缩等。
因此，如果要对视频去噪，最好能知道有噪视频的生成过程，即所谓的model of processing chain。
然而，该model通常是未知且难以建模的，并且这些噪声通常是与信号相关的（signal-dependent）。
为此，本文作者提出了model-blind的逐帧去噪方法。
为了达到较好的无监督学习性能，该网络是从预训练的DnCNN上fine-tune的。
作者还提出了两种训练模式：on-line和off-line。在on-line模型下，该网络会根据输入视频的前几帧进行fine-tune；在off-line模式下，则可以用一批视频进行训练，效果更好。
本文受到了Noise2Noise思想和one-shot object video segmentation训练方法的启发。在one-shot中，作者借助一个预训练的分割网络，在第一帧中标注目标并fine-tune，以完成视频其余帧的分割任务；在Noise2Noise中，训练目标是最小化同一张图像的两个有噪版本之间的差异。本文类似于one-shot的去噪版本，且无需任何干净图像：将视频的相邻帧作为训练目标。

引述本文的一句话：

In this work we show that, for certain kinds of noise, in the context of video denoising one video is enough: a network can be trained from a single noisy video by considering the video itself as a dataset.

本文方法

流程

刚刚说了，我们需要从一个预训练的去噪网络出发。这是因为我们的训练集很小（线上模式只有该视频的几帧）。这也是借鉴one-shot的。

此外，我们假设视频中的相邻帧是同一自然图像的两种有噪分布。但它们仍然存在微小的运动误差。为此，我们采用TV-L1光流[46,37]。该运动补偿方法非常快。补偿后采用双线性插值。显然这里有两点假设：

相邻帧的噪声分布独立；
运动补偿后的帧与参考帧的潜在干净图像是一致的。

还有，我们还考虑了遮挡，建立了一个遮挡膜（occlusion mask）。我们采用了[4]的简单方法：当光流散度较大时，我们就认为出现了遮挡情况，该点遮挡膜值为1，否则为0。

最后，我们计算损失时，出现遮挡的就不计入计算。即损失等于原损失乘以遮挡膜。

作者采用的是$L_1$损失。首先声明，选择损失函数要根据噪声的特性。但在噪声属性未知或复杂的情况下，最直接的办法就是：逐个实验，选其最佳。作者选择$L_1$，是因为其表现比$L_2$更好[50]，并且能处理包含泊松、JPEG压缩、低频等噪声。

训练

在线下训练时，我们会对整个视频进行迭代。训练目标是$L_1$损失，迭代若干次。

在线上训练时，我们逐帧训练。随着视频播放，迭代帧数会越来越多。这有点契合了life-long learning[47]的思想。

注意，我们还可以换反方向进行运动补偿，从而获得了双倍的训练数据用于迭代。

实验

实验采用的预训练网络，是在标准差25的AWGN下训练的DnCNN。

本文可能是第一篇视频盲去噪工作。因此，作者与Noise clinic、VBM3D和DnCNN进行了对比。

如图，首先探究的是在标准差为25的AWGN下的表现。此时DnCNN表现正常，本文方法无论何种模式，都与DnCNN不相上下。

其次，我们探究在标准差为50的AWGN下的表现。此时，DnCNN表现辣眼睛，而本文方法通过fine-tune逐渐地趋于优秀。

此外，我们还探究了其他噪声：混合高斯、相关、椒盐、JPEG噪声等。效果如图，盲去噪真香！：

两种模式主要差异：线下模式会更稳定，方差更小。

此外还有一个发现：本文方法和DnCNN一样，都会趋于过度平滑。如果将预训练网络换成其他更保真的视频去噪方法，可能会改善这个问题。

Paper | Model-blind video denoising via frame-to-frame training的更多相关文章

论文笔记：Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering
Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering 2019-04-25 21: ...
frame与frame之间怎么用jquery传值
frame与frame之间如何用jquery传值使用jquery操作iframe 1. 内容里有两个ifame <iframe id="leftiframe"...< ...
com.rabbitmq.client.impl.Frame.readFrom(Frame.java:95)
RabbitMQ 基于Erlang 实现, 客户端可以用Python | Java | Ruby | PHP | C# | Javascript | Go等语言来实现.这里做个java语言的测试.首先 ...
Note for video Machine Learning and Data Mining——training vs Testing
Here is the note for lecture five. There will be several points 1. Training and Testing Both of th ...
Paper | Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising
目录故事背景网络结构 BN和残差学习拓展到其他任务发表在2017 TIP. 摘要 Discriminative model learning for image denoising has b ...
Research Guide for Video Frame Interpolation with Deep Learning
Research Guide for Video Frame Interpolation with Deep Learning This blog is from: https://heartbeat ...
CVPR2016 Paper list
CVPR2016 Paper list ORAL SESSIONImage Captioning and Question Answering Monday, June 27th, 9:00AM - ...
paper 15 ：整理的CV代码合集
这篇blog,原来是西弗吉利亚大学的Li xin整理的,CV代码相当的全,不知道要经过多长时间的积累才会有这么丰富的资源,在此谢谢LI Xin .我现在分享给大家,希望可以共同进步!还有,我需要说一下 ...
### Paper about Event Detection
Paper about Event Detection. #@author: gr #@date: 2014-03-15 #@email: forgerui@gmail.com 看一些相关的论文. 1 ...

随机推荐

c++用流控制成员函数输出数据
#include<iostream> #include<iomanip> using namespace std; int main() { ; double b=314159 ...
vscode源码分析【一】从源码运行vscode
安装git,nodejs和yarn 安装Python27,3.x版本的不行,确保它在你的环境变量里: 安装gulp npm install --global gulp-cli 安装windows bu ...
1+X证书web前端开发中级对应课程分析
官方QQ群 1+x 证书 Web 前端开发 JavaScript 专项练习 http://blog.zh66.club/index.php/archives/198/ 1+x 证书 Web 前端开发初 ...
python接口自动化9-ddt数据驱动
前言 ddt:数据驱动,说的简单一点,就是多组测试数据,比如点点点的时候登录输入正常.异常的数据进行登录. 实际项目中,自动化测试用得很少,但也有人用excel来维护测试数据一.ddt 1.安装:p ...
pytest执行用例时从conftest.py抛出ModuleNotFoundError：No module named 'XXX'异常的解决办法
一.问题描述在项目根目录下执行整个测试用例,直接从conftest.py模块中抛出了ModuleNotFoundError:No module named 'TestDatas'的异常: 二.解决方 ...
Apollo的基本概念和集成实战
基本概念使用场景是一个分布式的配置中心.适用于微服务: 核心功能集中管理不同环境,不同集群的配置: 配置修改后可以实时推送到应用端: 具备规范的权限,流程治理特性: 开发技术服务端使用spri ...
Generating a new SSH key
Open Git Bash. Paste the text below, substituting in your GitHub email address. $ ssh-keygen -t rsa ...
Nginx之前后端分离（入门）
几个月前,公司架构优化,首先就是前后端分离. 所谓前后端分离,就是在传统的前后端代码都在一个项目里的基础上,将前后端代码抽离,把前端代码从后端项目了分离出来,前后端开发人员各自在自己的项目里开发. 为 ...
ZooKeeper（二）：多个端口监听的建立逻辑解析
ZooKeeper 作为优秀的分布系统协调组件,值得一探究竟.它的启动类主要为: 1. 单机版的zk 使用 ZooKeeperServerMain 2. 集群版的zk 使用 QuorumPeerMai ...
前端之javascript1
js介绍和js引入页面学习前端脚本语言javascript的基本概念.页面引入方式.获取页面元素及操作元素属性的技巧,学习函数的基本定义方法和使用方法. JavaScript介绍 JavaScrip ...

Paper | Model-blind video denoising via frame-to-frame training

故事

本文方法

流程

训练

实验

Paper | Model-blind video denoising via frame-to-frame training的更多相关文章

随机推荐

热门专题