"Generative Adversarial Nets" Notes

ToddyG 2024-09-03 11:52:25 原文

- Ian J.Goodfellow

中文翻译：https://blog.csdn.net/wspba/article/details/54577236

代码实现：https://github.com/devnag/pytorch-generative-adversarial-networks/blob/master/gan_pytorch.py

Abstract

G：恢复训练样本的分布

D：在任何分布下产生错误的概率都是1/2

1. Introduction

深度学习的目标是用丰富的层次模型（rich, hierarchical models），表达人工智能领域任意种类数据的分布（distribution）。

当前深度学习领域最为成功的，是判别模型（discriminative models），主要成功基于反向传播（backpropagation）和丢弃（dropout）算法。

生成模型（generative models）的成就较少，原因在于计算极大似然估计（maximum likelihood estimation）和相关策略的概率计算困难，以及在生成的上下文中（generative context）很难使用分段线性单元的好处。本文提出了一个新的生成模型来解决这些问题。

这篇文章的生成模型（Generator）和判别模型（Discriminator）都是用多层感知机（multiplayer perceptron, 即全连接层）实现的，用简单有效的反向传播算法和dropout算法就可以训练。不需要近似推理和马尔可夫链。

2. Related work

数学基础不够，看不懂。

3. Adversarial nets

G(z; θg)：多层感知机，可微函数，输入噪音，通过多层感知机参数θg生成。

D(x; θd)：多层感知机，输出一个单独的标量。

训练D：最大化分配正确标签的概率（输入是真实图像和生成图像, training examples and samples from G）。

训练G：最小化 log(1 - D(G(z)))

上述方程无法为G提供足够的梯度来学习，训练初期，G生成的图像很差，D会以高置信度来拒绝生成的样本，因为他们和训练数据明显不同。这个时候，log(1 - D(G(z))) 就会饱和。

因此在训练G的时候，我们选择最大化 log(D(G(z))) 而不是最小化 log(1 - D(G(z))) 。

这样就能在训练初期为G提供较大的梯度。

这里可能不是说的很清楚，原文：This objective function results in the same fixed point of the dynamics of G and D but provides much stronger gradients early in learning.

4. Theoretical Results

5. Experiments

6. Advantages and disadvantages

7. Conclusions and future work

"Generative Adversarial Nets" Notes的更多相关文章

论文笔记之：Conditional Generative Adversarial Nets
Conditional Generative Adversarial Nets arXiv 2014 本文是 GANs 的拓展,在产生和判别时,考虑到额外的条件 y,以进行更加"激烈 ...
（转）Deep Learning Research Review Week 1: Generative Adversarial Nets
Adit Deshpande CS Undergrad at UCLA ('19) Blog About Resume Deep Learning Research Review Week 1: Ge ...
论文笔记之：Generative Adversarial Nets
Generative Adversarial Nets NIPS 2014 摘要:本文通过对抗过程,提出了一种新的框架来预测产生式模型,我们同时训练两个模型:一个产生式模型 G,该模型可以抓住数据分 ...
Generative Adversarial Nets[BEGAN]
本文来自<BEGAN: Boundary Equilibrium Generative Adversarial Networks>,时间线为2017年3月.是google的工作. 作者提出 ...
Generative Adversarial Nets[content]
0. Introduction 基于纳什平衡,零和游戏,最大最小策略等角度来作为GAN的引言 1. GAN GAN开山之作图1.1 GAN的判别器和生成器的结构图及loss 2. Condition ...
Generative Adversarial Nets[CycleGAN]
本文来自<Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks>,时间线为2017 ...
Generative Adversarial Nets[CAAE]
本文来自<Age Progression/Regression by Conditional Adversarial Autoencoder>,时间线为2017年2月. 该文很有意思,是如 ...
Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言本文主要思考的是 ...
Generative Adversarial Nets[Pre-WGAN]
本文来自<towards principled methods for training generative adversarial networks>,时间线为2017年1月,第一作者 ...

随机推荐

Notes 20180307 : 运算符
我们前边曾说过程序=数据结构+算法,数据结构讲的是数据在内存中的存储形式,这个我会作为2018的一个重点来研究,不过在这里不做赘述,前半年的工作以JavaSE为主.算法则是我们在数据结构的基础上对其的 ...
ARC下IBOutlet用weak还是strong
原文来自这里. 今天用Xcode5的时候,发现默认的IBoutlet的属性设置为weak——因为Xcode5建立的工程都是ARC的了.但是当时还有点不明白,因为项目的原因,一直没有正式使用过ARC.于 ...
jQuery语法、选择器、效果等使用
1．jQuery语法 1.1 基础语法:$(selector).action( ) 美元符号定义 jQuery 选择符(selector)“查询”和“查找” HTML 元素 jQuery 的 acti ...
JSP／Servlet开发——第二章 JSP数据交互（一）
1. JSP内置对象:JSP内置对象是 Web 容器创建的一组对象: ●JSP常用的内置对象:out.request.application.session.response等: ●内置对象不需要 ...
spring-构建mvc工程
SpringMVC基于模型-视图-控制器(MVC)模式实现,可以构建松耦合的web应用程序. 1.SpringMVC的请求过程 1)请求离开浏览器,并携带用户所请求的内容 2)DispatcherSe ...
chrome调试微信
打开微信,设法打开网址 http://debugx5.qq.com (推荐直接把这个网址发给文件传输助手,然后就可以直接打开链接了) 在打开的网页中选择 [信息]->[TBS settings] ...
linux操作系统的目录以及用户权权限的管理
linux操作系统的目录以及对目录的操作一: linux操作系统的目录结构 bin #可执行程序的安装目录 , 命令 boot #系统启动引导目录 dev #设备目录 etc #软件配置文件目录 ...
linux shell 字符串常用操作
1.shell内置的字符串操作表达式含义 ${#string} $string的长度 ${string:position} string中,从位置$position开始提取字符串 ${string ...
linux 搭建ss
因为收藏的各种教程被xx,所以决定自己写第一步.安装ss sudo pip install shadowsocks 第二步.配置IP.端口.密码.加密方式 vi /etc/shadowsocks.j ...
20145226夏艺华 JAVA预备作业1
博客阅读总结关于师生关系: 学生和老师之间我觉得关系时多元化的,不能拘泥于单独的一种关系:灌输与被灌输,教授与被教授--我认为,在不同的课程阶段,师生之间的关系都可以发生变化.前期的老师更像是一个指 ...