ICCV2019 oral：Wavelet Domain Style Transfer for an Effective Perception-distortion Tradeoff in Single Image Super-Resolution

引言

　　基于低分辨率的图像恢复高分辨图像具有重要意义，近年来，利用深度学习做单张图像超分辨主要有两个大方向：1、减小失真度（distortion, 意味着高PSNR）的图像超分辨，这类方法主要最小化均方误差；2、提高感知质量(perception)的图像。这类方法主要利用GAN来做约束，使得生成的图像和真实的高分辨率图像尽可能符合相同分布。这两大方向存在一种tradeoff，因为通常低失真度（高PSNR）的图像往往感知质量不高，不符合人眼认知，而高感知质量（本文用NRQM指标度量，高NRQM）的图像，用PNSR指标衡量较低。如下图：

　　当前有工作考虑分别用两个网络训练生成低失真度和高感知质量的图像，再进行插值融合。然而图像的objective quality和perception quality由图像的不同部分影响，如果将目标图像作为整体优化，提高objective quality时，perception quality会下降，反之亦然。因此本文提出一种新的两图像（低失真度和高感知图像）融合策略。本文利用小波变换将图像分解成低频部分和高频部分，低频部分影响objective quality，高频部分影响perception quality.

Motivation（动机）

　　论文将利用CX算法得到的高分辨图像$A_p$（high perception quality）、EDSR算法得到的高分辨图像$A_o$(high objective quality)、GroundTruth进行Haar小波分解,得到一个低频子带和三个高频自带，并展示它们的直方图，发现$A_o$图像低频部分和GroundTruth对应的低频部分分布很接近，而$A_p$的三个高频子带的分布和GroundTruth对应的高频子带分布很接近。

算法:

　　将$A_o$分解为 $LL^{o}, LH^{o}, HL^{o}, HH^{o}$, $A_p$分解为$LL^{p}, LH^{p}, HL^{p}, HH^{p}$, 融合后的图像子带$LL^{r}$, $LH^{r}$, $HL^{r}$, $HH^{r}$.算法总体框架如下：

　　利用LSE网络，以$LL^{o}$作为输入恢复$LL^{r}$，利用WDST网络，以$LH^{o}$,$LH^{p}$，$LH^{r}$作为网络输入，其中$LH^{r}$作为可训练参数（具体细节后面再说）。$HL^{r}$,$HH^{r}$同理可得。

LSE网络如下：

WDST网络如下：

第一部分：重构$LL^{r}$

　　考虑GroundTruth的$LL^{gt}$子带和$LL^{o}$最相似，直接用$LL^{o}$恢复。利用VDSR网络思想，网络学习$LL^{gt}$和$LL^{o}$的残差。损失函数如下：

　　其中$LL^{r}$为$LL^{o}$和网络的输出。重构网络为LSE网络。

训练细节：

　　网络的训练以学习率1e-3,SGD优化算法（动量为0.9，衰减因子1e-4），梯度裁剪完成。

第二部分：重构$LH^{r}$, $HL^{r}$, $HH^{r}$

　　拿$LH^{r}$举例，用$LH^{o}$和$LH^{p}$融合得到$LH^{r}$.考虑到$LH^{p}$中的小波系数内容比$LH^{o}$的丰富，非0系数更多，期望将$LH^{p}$中的细节小波系数变换到$LH^{o}$中，因此将$LH^{p}$作为风格输入(style input)，$LH^{o}$作为内容输入(content input)。不同于传统的风格迁移算法——输入是像素值，这里的输入小波系数，因此首先将小波系数归一化到0-1（值减去最小值，再除以最大值）

　　损失函数有三个：content loss($L_c$), style loss($L_s$)和$L_1$范数损失（保持重构小波系数的稀疏性）。如下：

　其中

　　这里实际上是基于预训练的VGG作为WDST网络，只有一个参数是可训练的，那就是$LH^{r}$.

训练细节：用的L-BFGS优化算法.$\alpha=1e-3, \omega=0.2, \beta=1, \gamma=1e-5$

实验结果

　　定量结果（PSNR/NRQM）：

　　定性结果：

对比实验：

1、考虑不同小波分解产生的影响：

根据实验可以看出，用不同小波分解对实验结果影响不大。

2、不同高频子带重构，对最终的影响

可以看出三个高频子带都有贡献，相比于$LH, HL$,$HH$的贡献最小，因为$HH$为对角方向信息，不如$LH, HL$他们携带的信息多。

ICCV2019 oral：Wavelet Domain Style Transfer for an Effective Perception-distortion Tradeoff in Single Image Super-Resolution的更多相关文章

Image Style Transfer：多风格 TensorFlow 实现
·其实这是一个选修课的present,整理一下作为一篇博客,希望对你有用.讲解风格迁移的博客蛮多的,我就不过多的赘述了.讲一点几个关键的地方吧,当然最后的代码和ppt也希望对你有用. 1.引入: 风格 ...
项目总结四：神经风格迁移项目（Art generation with Neural Style Transfer）
1.项目介绍神经风格转换 (NST) 是深部学习中最有趣的技术之一.它合并两个图像, 即内容图像 C(content image) 和样式图像S(style image), 以生成图像 G(ge ...
课程四(Convolutional Neural Networks)，第四周（Special applications: Face recognition & Neural style transfer） —— 2.Programming assignments：Art generation with Neural Style Transfer
Deep Learning & Art: Neural Style Transfer Welcome to the second assignment of this week. In thi ...
pytorch实现style transfer
说是实现,其实并不是我自己实现的亮出代码:https://github.com/yunjey/pytorch-tutorial/tree/master/tutorials/03-advanced/n ...
DeepLearning.ai-Week4-Deep Learning & Art: Neural Style Transfer
1 - Task Implement the neural style transfer algorithm Generate novel artistic images using your alg ...
Perceptual Losses for Real-Time Style Transfer and Super-Resolution and Super-Resolution 论文笔记
Perceptual Losses for Real-Time Style Transfer and Super-Resolution and Super-Resolution 论文笔记 ECCV 2 ...
fast neural style transfer图像风格迁移基于tensorflow实现
引自:深度学习实践:使用Tensorflow实现快速风格迁移一.风格迁移简介风格迁移(Style Transfer)是深度学习众多应用中非常有趣的一种,如图,我们可以使用这种方法把一张图片的风格“ ...
《Perceptual Losses for Real-Time Style Transfer and Super-Resolution》论文笔记
参考 http://blog.csdn.net/u011534057/article/details/55052304 代码 https://github.com/yusuketomoto/chain ...
[C4W4] Convolutional Neural Networks - Special applications: Face recognition & Neural style transfer
第四周:Special applications: Face recognition & Neural style transfer 什么是人脸识别?(What is face recogni ...

随机推荐

nginx的错误处理
以下是针对nginx发生错误的处理方案(将会持续更新) 遇到 nginx: [error] invalid PID number "" in "/var/run/ngin ...
java+layui的Excel导入导出
html: <button class="layui-btn" onclick="exportData();">导出</button> ...
Django初步皮毛
Django是一个用python编写的Web框架. #Django安装 pip install Django 然后是配置环境变量,将这目录添加到系统环境变量中: C:\Python33\Lib\sit ...
前端框架vue.js系列（9）：Vue.extend、Vue.component与new Vue
前端框架vue.js系列(9):Vue.extend.Vue.component与new Vue 本文链接:https://blog.csdn.net/zeping891103/article/det ...
easyui的combogrid
easyui的combogri下拉框用在项目中很多,有时会出现很多问题,当然也好解决. 1.当向后台传id值时,用户输入的与查询出来的显示值一样,但combogrid为空? 情景:输入‘李四’,和显示 ...
Eqaulize Prices
There are n products in the shop. The price of the ii-th product is aiai. The owner of the shop want ...
JAVA中fail-fast机制
在JDK的Collection中我们时常会看到类似于这样的话: 例如,ArrayList: 注意,迭代器的快速失败行为无法得到保证,因为一般来说,不可能对是否出现不同步并发修改做出任何硬性保证.快速失 ...
Bugku-CTF之本地包含( 60）
Day36
AcWing 858. Prim算法求最小生成树稀疏图
//稀疏图 #include <cstring> #include <iostream> #include <algorithm> using namespace ...
【代码总结】Struts2 拦截器的处理机制
一.什么是拦截器拦截器是一个类,可以在Action被调用之前和之后执行代码,通常框架的很多功能都是拦截器实现的,如接收输入的参数.数据验证.文件上传等二.工作方式做一些Action执行前的预处理 ...

ICCV2019 oral：Wavelet Domain Style Transfer for an Effective Perception-distortion Tradeoff in Single Image Super-Resolution

ICCV2019 oral：Wavelet Domain Style Transfer for an Effective Perception-distortion Tradeoff in Single Image Super-Resolution的更多相关文章

随机推荐

热门专题