故事
网络设计
训练

发表于2017年CVPR。

目标：JPEG图像去压缩失真。

主要内容：

同时使用感知损失、对抗损失和JPEG损失（已知量化间隔，惩罚落在间隔外的值），让恢复图像主客观质量都更好。
对像素进行平移-均值化处理，进一步抑制块效应。

亮点：解释了one-to-many的合理性：由于图像恢复是欠定问题，因此理应有多张潜在的高质量图像可供选择。但是最终没有体现one-to-many啊摔！而是加权组合了这三个损失函数，没有多输出。

评分：⭐⭐

故事

有损压缩被广泛使用，但是带来伪影。 => 去除伪影（压缩失真）是很重要的，因为伪影会导致用户观感下降和视觉任务精度下降。 => 当前，深度学习已经展示了强大的性能，但普遍导致过度平滑。
JPEG压缩失真主要是由于每个块的独立量化导致的边缘不连续（块效应）。量化是一个多对一的映射，然而目前的网络大多是一对一映射。因此，对于一张有损图像，我们应该得到多张潜在的高质量图像，再挑选。因此，一对多映射是更好的学习方式。毕竟，一千个人心中有一千个哈姆雷特。
一对多映射，就涉及到多个衡量标准。 => 首先，per-pixel损失是不够的。很简单的例子：我们将图像平移一下，per-pixel损失就会特别大。但二者的本质是一样的。 => 因此，我们引入感知质量。感知质量可以衡量高层语义上的距离。 => 但是，感知质量也不够：它对粗糙纹理的辨别能力不强【这里的论证太弱】。因此我们引入对抗损失，可以将网络引向更逼真的纹理细节。 => 在像素域上也希望有约束，因此引入JPEG损失，对落在量化间隔外的样本进行惩罚（已知量化水平和量化表）。
最后，作者还引入了平移-均值化（shift-and-average）方法，进一步抑制块效应（grid-like artifacts）。

网络设计

网络前端

\(Z\)是AWGN，经过卷积后，会与有损图像\(Y\)的卷积相加，目的是让网络更健壮。有点意思。
一句话挺有意思：

As JPEG compression is not optimal, redundant information neglected by the JPEG encoder may still be found in a compressed image.
其中的降采样是步长为2的\(4 \times 4\)卷积，升采样是步长为2的\(4 \times 4\)反卷积。之所以降采样：（1）降低计算量；（2）增大感受野。

升采样中的平移-均值化

这里作者介绍了为什么要、如何做平移-均值化。

假设该信号中每一个值都是常数c。做步长为2的\(4 \times 4\)反卷积的步骤：首先插2个零，变成c00c，然后在卷积时就是平移取互相关。

作者发现，若我们平移一位再做反卷积，然后两个结果求平均，那么结果就是我们想要的常数结果。否则，结果非处处为常数。

当然，作者没有详细说明这样做的合理性。这不过是一个成功的例子。

网络度量

感知损失借助[39]的VGG-16，对抗损失借助[34]的DCGAN。

JPEG损失具体：计算有损图像\(Y\)和重建图像\(\hat{X}\)在每个像素点的距离。理想情况下，如果无损图像某个点的值是\(X\)，那么其量化后的值\(Y\)不会超过其正负半个量化间隔。即，二者距离不会超过半个量化间隔。同理，计算出来的结果也应该在半个量化间隔内。

如果超过量化间隔的一半，就作为损失惩罚；若不大于一半，那么就为0。即取一个\(max(dis, 0)\)函数。

训练

果不其然，训练是综合三个损失函数，并非多输出。这怎么能叫one-to-many？？？

Paper | One-to-Many Network for Visually Pleasing Compression Artifacts Reduction的更多相关文章

Paper | Compression artifacts reduction by a deep convolutional network
目录 1. 故事 2. 方法 3. 实验这是继SRCNN(超分辨)之后,作者将CNN的战火又烧到了去压缩失真上.我们看看这篇文章有什么至今仍有启发的故事. 贡献: ARCNN. 讨论了low-lev ...
【Paper】Deep & Cross Network for Ad Click Predictions
目录背景相关工作主要贡献核心思想 Embedding和Stacking层交叉网络(Cross Network) 深度网络(Deep Network) 组合层(Combination Laye ...
读paper:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, andScore-level Fusion for Face Recognition
今天给大家带来一篇来自CVPR 2017关于人脸识别的文章. 文章题目:Deep Convolutional Neural Network using Triplets of Faces, Deep ...
Paper | Dynamic Residual Dense Network for Image Denoising
目录 1. 故事 2. 动机 3. 做法 3.1 DRDB 3.2 训练方法 4. 实验发表于2019 Sensors.这篇文章的思想可能来源于2018 ECCV的SkipNet[11]. 没开源, ...
Paper | A Pseudo-Blind Convolutional Neural Network for the Reduction of Compression Artifacts
目录非盲增强网络结构训练目标压缩系数预测子网络网络结构根据块QP判决结果得到帧QP预测结果保持时序连续性实验发表在2019年TCSVT. 本文提出了一个兼具预测压缩系数和非盲去压 ...
Paper | Non-Local ConvLSTM for Video Compression Artifact Reduction
目录 1. 方法 1.1 框图 1.2 NL流程 1.3 加速版NL 2. 实验 3. 总结 [这是MFQE 2.0的第一篇引用,也是博主学术生涯的第一篇引用.最重要的是,这篇文章确实抓住了MFQE方 ...
CVPR 2017 Paper list
CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View ...
Deep Learning-Based Video Coding: A Review and A Case Study
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 1.Abstract: 本文主要介绍的是2015年以来关于深度图像/视频编码的代表性工作,主要可以分为两类:深度编码方案以及基于传统编码方 ...
DeepCoder: A Deep Neural Network Based Video Compression
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract: 在深度学习的最新进展的启发下,我们提出了一种基于卷积神经网络(CNN)的视频压缩框架DeepCoder.我们分别对预测 ...

随机推荐

【洛谷5335】[THUSC2016] 补退选（指针实现Trie）
点此看题面大致题意: 三种操作:加入一个字符串,删除一个字符串,求最早什么时候以某个字符串为前缀的字符串个数超过给定值. \(Trie\) 这道题显然是\(Trie\)的暴力裸题. 考虑我们对于\( ...
如何查看PDF的坐标
有时候,我们明知道现状并不够科学.不够合理,但没有时间和条件去改变现状,还得硬要照着这种方式去维护,很是痛苦. 在程序生成文字报告通常使用docx,如果需要更通用.更灵活,还可以使用rtf,而前期设计 ...
postman测试文件上传接口教程
postman是一个很好的接口测试软件,有时候接口是Get请求方式的,肯定在浏览器都可以测了,不过对于比较规范的RestFul接口,限定了只能post请求的,那你只能通过工具来测了,浏览器只能支持ge ...
拎壶学python3-----（1）输出与字符转换
一.输入自己的名字打印二.数字和字符串是不能相加的如下怎么解决上边的问题呢? 如果是相加我们要把字符串转成数字类型如下如果不想让他相加可以写成这样如下: ok,关于转换就先讲到这里
C# MediaPlayer
using System.Windows.Media; using Newtonsoft.Json; using System.ComponentModel; namespace ConsoleApp ...
用Python进行数据清洗，这7种方法你一定要掌握
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者 | 常国珍.赵仁乾.张秋剑来源 |<Python数据科学:技术 ...
centOS服务器添加电脑ssh key以支持远程登陆
1,生成电脑的密钥对(在powershell或cmd命令行中) ssh-keygen -t rsa -C "自己的邮箱" 2.打开刚刚生成的电脑公钥(~即代表用户主目录,/则代表根 ...
移动端适配方案（rem+flex）
为什么用rem不用px? 主流:各大网站的移动版绝大多数都是用的rem. 移动端屏幕分辨率差别太大:最低适配的iPhone6,分辨率仅为750*1334.而现在市面上大多数手机,都达到了1080* ...
JavaScript中break、continue和return的区别
break function myBreak() { for(var i = 0; i < 5; i++) { if(i == 3) { break; } console.log(i); } } ...
[20190517]rman tape compressed.txt
[20190517]rman tape compressed.txt --//前一段测试rman选择压缩备份时,如果备份单个数据文件小于64M-3*8K时,先建立大小64M文件,最后会回收到自己的备份 ...

Paper | One-to-Many Network for Visually Pleasing Compression Artifacts Reduction

故事