《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks》研读笔记
《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks》研读笔记
论文标题:DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks
来源:ICCV 2017
摘要:
尽管手机中的嵌入式照相机的性能在快速地发展,但是它们所受到的物理限制——较小的感光器件,精简的镜头和缺少特定的硬件——制约着手机的相机拍出与DSLR(单反)同样质量的照片。在本工作中,我们展示了一个端对端的深度学习的方法来弥补这一差距,该方法可以通过将原始的手机相片转换为高质量的单反相机拍出来的图片。我们提出通过应用残差卷积神经网络来提升图片的颜色呈现和图像的锐度。由于标准的均方误差并不适合用来衡量图像的感知质量,因此我们引入了一个由内容误差、颜色误差与纹理误差合成的感知误差函数。头两个误差通过分析得出,纹理误差则通过一种对抗式的方式学习得到。我们还展示了DPED,一个大规模的包含采自于三个不同的手机和一个高端反光相机图片的数据集。我们定量和定性的评估表明通过所提出的算法增强后的图片的质量和单反相机拍出的照片的质量是相当的,同时结果还表明该方法还可以被应用任何类型的数码相机中。
论文主要内容:
1、引言
尽管最近几年手机相机中使用的精简的感光单元取得了极大的进步,使得手机的拍照效果获得了巨大的提升。然而,目前手机的拍照效果依然不如单反数码相机的效果好。因为单反相机有着更大的感光单元和大口径光学镜头,这使得照片能够有更好的分辨率、颜色呈现效果。鉴于额外的感光器件帮助调整拍摄参数,也有着更低的噪声。这些物理差异为手机相机的拍照质量造成了极大的阻碍,使其难以获得与单反相机同样的拍摄效果。现有的一些图像自动增强的工具一般都关注的是全局参数的调整,例如:对比度和亮度,忽视了纹理的质量与图像的语义。此外,这些工具一般都使用一些预定义(pre-defined)的规则,而并没有考虑到某一设备的特性。因此,图片处理的主要方式人工通过某种图像修整工具来完成。
1.1 相关研究
图像质量增强和如下的几个子领域有关:
(1)图像超像素(super-resolution);
(2)图像去雾(dehazing);
(3)图像去噪(denoising);
(4)图像上色(colorization);
(5)图像调整:曝光调整、风格调整等。
1.2 贡献
(1)提出了一个新的图像增强算法,该算法基于学习手机设备照片与DSLR所拍摄的照片之间的映射函数。目标模型使用一个端对端的训练方式,因此不需要任何额外的监督或者特征工程;
(2)采集了一个大规模的超过6000照片的数据库,这些照片涵盖了很多场景,并且是同时由三个低端手机相机与DSLR相拍摄得到的;
(3)提供了一个由颜色损失、纹理损失及内容损失所组成的损失函数,保证有效的图像质量估计;
(4)进行了客观的、主观实验,显示了被增强的图片对原始图片的优势,同时也展现了其与单反相机间相当的质量。
2、DPED数据库
该数据库通过对同一场景,分别使用四个取相设备来获得。取相设备中包括三个手机相机和一个单反相机。用来采集图像的设备如下图2所示。一些图片样例子如图3所示。


为了保证对每一场景,四个相机能够同时取相,因此将这些设备都方式在一个三角架上面,通过无限控制系统来远程启动这四个设备。这些图像都是通过各个相机的默认设置来获取的。由于各个取相设备之间的位置和观察角度存在着区别,因此所拍出来的图片并没有很好地配准。因此文章作者还提出使用非线性变换来获得固定分辨率地图片。方法大致为:计算每一对相机图片与单反图片之间的匹配SIFT关键点。然后使用使用RANSAC来估计一个homography。最后对两张图片进行裁切,保留重叠的部分,将单反的图片的尺寸变为手机相片的尺寸。在训练CNN的时候使用的是从图片中抽取的100*100的图片块。这些图片块是使用不重叠的滑动窗口来从相机-单反图片对中抽取的。
、方法
3.1 损失函数
)颜色质量;2)纹理质量;3)内容质量。下面逐一介绍衡量这些质量的损失函数。
)颜色损失
使用经过高斯模糊之后的图片之间的欧时距离来衡量被增强后的图片与目标图片之间的颜色损失。

)纹理损失
基于GAN来直接学习一个合适的衡量纹理质量的标准。
)内容损失
使用VGG-19网络中relu 5_4层所产生的特征图之间的差异来表示图片之间的内容差异。

)总变化误差
使用所生成图片在两个方向上的梯度平均值。

)总误差

3.2 模型架构
架构如下图,算法代码地址为:http://people.ee.ethz.ch/~ihnatova/index.html。

、实验
通过与一些相关方法和工具之间进行定性与定量的比较来评价算法的效果
4.1 对比方法
比较的方法与工具包括:
Apple Photo Enhancer(APE):自动化图像增强的商业软件;
Dong et. al:超像素方法;
Johnson et. Al:超像素方法;
张图片进行颜色、锐度及总体感觉进行手动调整。
4.2 量化评价
使用PSNR及SSIM作为衡量标准来量化比较APE、Dong et. al及Johnson et. al及文章中所提出算法的表现。计算应用上述四种方法处理后的图片与由单反拍摄的图片之间的PSNR与SSIM。数据如下表所示。

4.3 用户研究
由于本文的目标是将手机拍摄的照片转化为单反的质量。为了衡量总体的质量,我们设计了一个无参照的用户研究。在用户研究中,被试人被要求从所展示的图片中选择看起来最好的一张图片。主要进行的比较实验包括:
)原始底端相机拍摄的图片、单反相机拍摄的图片与由所提出的方法增强过的图片。
个场景的图片个底端相机,因此本次实验一共要进行81次询问。
)只使用iPhone所拍摄的图片,分别与由专家修饰过的图片、由APE自动调整过的图片和由本文所提出方法转换过的图片进行比较。上述两个实验的结果如下:

图中前三个子图表示的是第一个比较试验的结果。第四表示的是第二个比较试验的结果。每一个柱子都代表着实验中某一种图像被选择的比例。
《DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks》研读笔记的更多相关文章
- Very Deep Convolutional Networks for Large-Scale Image Recognition
Very Deep Convolutional Networks for Large-Scale Image Recognition 转载请注明:http://blog.csdn.net/stdcou ...
- 目标检测--Spatial pyramid pooling in deep convolutional networks for visual recognition(PAMI, 2015)
Spatial pyramid pooling in deep convolutional networks for visual recognition 作者: Kaiming He, Xiangy ...
- VGGNet论文翻译-Very Deep Convolutional Networks for Large-Scale Image Recognition
Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan[‡] & Andrew Zi ...
- Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition Kaiming He, Xiangyu Zh ...
- SPPNet论文翻译-空间金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
http://www.dengfanxin.cn/?p=403 原文地址 我对物体检测的一篇重要著作SPPNet的论文的主要部分进行了翻译工作.SPPNet的初衷非常明晰,就是希望网络对输入的尺寸更加 ...
- 2014-VGG-《Very deep convolutional networks for large-scale image recognition》翻译
2014-VGG-<Very deep convolutional networks for large-scale image recognition>翻译 原文:http://xues ...
- 深度学习论文翻译解析(九):Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
论文标题:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 标题翻译:用于视觉识别的深度卷积神 ...
- 论文笔记:(2019CVPR)PointConv: Deep Convolutional Networks on 3D Point Clouds
目录 摘要 一.前言 1.1直接获取3D数据的传感器 1.2为什么用3D数据 1.3目前遇到的困难 1.4现有的解决方法及存在的问题 二.本文idea 2.1 idea来源 2.2 初始思路 2.3 ...
- [CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...
随机推荐
- C++ std::forward_list 基本用法
#include <iostream> #include <string> #include <forward_list> using namespace std; ...
- 【洛谷5643】[PKUWC2018] 随机游走(Min-Max容斥+待定系数法+高维前缀和)
点此看题面 大致题意: 从一个给定点出发,在一棵树上随机游走,对于相邻的每个点均有\(\frac 1{deg}\)的概率前往.多组询问,每次给出一个点集,求期望经过多少步能够访问过点集内所有点至少一次 ...
- xamarin调试android部署到模拟器错误记录:Deployment failed Mono.AndroidTools.InstallFailedException: Unexpected install output: Error: Could not access the Package Manager. Is the system running?
问题记录: 1.生成 ok. 2.昨天也是能部署到模拟器的. 但是今天部署的时候就报了这样的一个错误 Deployment failed Mono.AndroidTools.InstallFailed ...
- Hyperledger Fabric相关文件解析
1相关文件说明 这一部分涉及相关配置文件的解析, 网络的启动涉及到多个文件,本文按以下顺序进行分析: . ├── base │ ├── docker-compose-base.yaml #1 │ ...
- 一起学Android之Handler
概述 在Android开发中,有主线程(UI线程)和工作线程(Worker线程)之分,两个线程是相互独立的,并不能相互访问(主线程主要负责UI的更新,不能进行耗时的操作,工作线程主要负责耗时的操作,但 ...
- PostgreSQL 修改表字段常用命令
--数据库.模式.表名 "identities"."Test"."tab_test" --修改字段名 ALTER TABLE "i ...
- hadoop免登录
参考:http://wenku.baidu.com/link?url=n4PT7AhGnV7N8KevSEAMcCVGEaYqTuKmNodCQsUnR7qtAnWM0WDs8pFYLOpCUu9R9 ...
- raid组合优缺点介绍和创建LVM实验个人笔记
一.RAID组合介绍 RAID模式优缺点的简要介绍 1.raid 0 模式 优点:在RAID 0状态下,存储数据被分割成两部分,分别存储在两块硬盘上,此时移动硬盘的理论存储速度是单块硬盘的2倍,实际容 ...
- nginx常见问题总结
1.当有多个server{}时先匹配哪个?如果请求同时命中多个server,则先从上到下(如果是分布在多个配置文件中,则在文件夹中摆放在前面的文件优先被读取)先匹配到哪个算哪个. 2.location ...
- ArrayList的输出以及一些问题
//首先需要创建一个ArrayList ArrayList arr=new ArrayList(); //然后往ArrayList里面插入一些值 arr.add("a"); arr ...