Image-to-Image Translation with Conditional Adversarial Networks

(基于条件gan的图像转图像)

作者:Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

全文链接:https://arxiv.org/abs/1611.07004

GANs是一种生成模型,它学习从随机噪声向量z到输出图像y的映射。条件GAN学习从观测图像x和随机噪声向量z到y的映射。生成器G经过训练后产生的输出不能通过反向训练的判别器D从“真实”图像中分辨出来,D经过训练以尽可能好地检测生成的“赝品”。这个训练过程如图2所示。

条件GAN的目标可以表示为:

在对抗中,G试图将这个目标最小化,D试图使它最大化,G* = arg minG maxD LcGAN(G;D).

鉴别器的工作保持不变,但生成器的任务不仅是欺骗鉴别器,而且在L2意义上接近真值输出。基于这个需求,使用L1距离而不是L2作为参数。L1鼓励减少模糊。

目标函数变为:

生成器和鉴别器都使用卷积-BN处理- relu格式的模块。Pix2pix网络能够让图像和目标图像的像素值一一对应。

生成器采用Unet结构,跳层连接的方式。

马尔可夫链的鉴别器(PatchGAN):给高频信息更高的关注,关注局部图像块。将判别器设计为对块进行单独判别的结构。判别器对于每张图片的判断,都将图片分割为N*N的块,判断这个N*N的图形块是生成的图形或者是真实图像。我们通过对图像进行卷积来运行这个鉴别器,对所有响应进行平均,从而得到D的最终输出。一个较小的PatchGAN的参数更少,运行速度更快,可以应用于任意大的图像。

假设像素之间的独立距离大于一个patch的直径,这种鉴别器可以有效地将图像建模为一个马尔可夫随机场。

为了优化网络,遵循标准方法:在D上的梯度下降步骤和G上的梯度下降步骤之间交替进行。

image-to-image translation with conditional adversarial networks文献笔记的更多相关文章

  1. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks 阅读笔记

    Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks (使用循环一致的对抗网络的非配对图像-图 ...

  2. (Pixel2PixelGANs)Image-to-Image translation with conditional adversarial networks

    Introduction 1. develop a common framework for all problems that are the task of predicting pixels f ...

  3. 《Image-to-Image Translation with Conditional Adversarial Networks》论文笔记

    出处 CVPR2017 Motivation 尝试用条件GAN网络来做image translation,让网络自己学习图片到图片的映射函数,而不需要人工定制特征. Introduction 作者从不 ...

  4. 《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks》论文笔记

    Code Address:https://github.com/junyanz/CycleGAN. Abstract 引出Image Translating的概念(greyscale to color ...

  5. CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks阅读笔记

    CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks 2020 CVPR 2005.09544.pdf ...

  6. StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记

    StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks  本文将利 ...

  7. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks(使用循环一致的敌对网络进行不成对的图像到图像转换)

    作者:朱俊彦,朱俊彦博士是计算机图形学领域现代机器学习应用的开拓者.他的论文可以说是第一篇用深度神经网络系统地解决自然图像合成问题的论文.因此,他的研究对这个领域产生了重大影响.他的一些科研成果,尤其 ...

  8. CycleGAN --- Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

    文章地址:http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhu_Unpaired_Image-To-Image_Translation_I ...

  9. 语音合成论文翻译:2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

    论文地址:MelGAN:条件波形合成的生成对抗网络 代码地址:https://github.com/descriptinc/melgan-neurips 音频实例:https://melgan-neu ...

随机推荐

  1. [转]Google的C++代码规范

    转自:https://blog.csdn.net/freeking101/article/details/78930381 英文版:http://google-styleguide.googlecod ...

  2. 在Eclipse中启动tomcat后访问tomcat首页时出现404

    在Eclipse中配置好tomcat后,把一个web项目发布到tomcat上去,当使用http://localhost:8080访问tomcat首页时出现404错误,但可以正常访问web页面,然而当在 ...

  3. Django 建立用户的视图(搜索 )

    在web应用上,有两个关于搜索获得巨大成功的故事:Google和Yahoo,通过搜索,他们建立了几十亿美元的业务.几乎每个网站都有很大的比例访问量来自这两个搜索引擎.甚至,一个网站是否成功取决于其站内 ...

  4. 转发 ----> 2018年阿里巴巴重要开源项目汇总(持续更新中)

    转发自segmentfault  https://segmentfault.com/a/1190000017346799 前端 1.数据驱动的高交互可视化图形语法 AntV - G2 G2 是一套基于 ...

  5. Python自学:第三章 倒着打印列表

    # -*- coding: GBK -*- #reverse: 相反的 cars = ["bmw", "audi", "toyota", & ...

  6. hsy单词

    题意:略 在ac自动机上,一个节点出现的次数等于能通过fail到它的节点的次数之和.而叶节点就等于它被爬过的次数. #include <iostream> #include <cst ...

  7. vue中data中引用本地图片报错404

    首先说明vue-cli中assets和static两个文件的区别 1.assets在项目编译的过程中会被webpack处理理解为模块依赖,如果执行npm run dev或npm run build命令 ...

  8. A*算法介绍

    你是否在做一款游戏的时候想创造一些怪兽或者游戏主角,让它们移动到特定的位置,避开墙壁和障碍物呢? 如果是的话,请看这篇教程,我们会展示如何使用A星寻路算法来实现它! 在网上已经有很多篇关于A星寻路算法 ...

  9. Layui追加合计

    parseData: function(res) { //将原始数据解析成table组件所规定的数据 admin.restest(res); var list = new Array(); var t ...

  10. Win10系列:C#应用控件进阶6

    路径 路径(Path)可以用来定义任意形状的曲线和几何图形,当然这种任意性也带来了复杂性.为了方便的绘制几何图形,微软在Visual Studio 2012安装包中为程序开发者提供了免费的Blend ...