"Generative Adversarial Nets" Notes

ToddyG 2024-09-03 11:52:25 原文

- Ian J.Goodfellow

中文翻译：https://blog.csdn.net/wspba/article/details/54577236

代码实现：https://github.com/devnag/pytorch-generative-adversarial-networks/blob/master/gan_pytorch.py

Abstract

G：恢复训练样本的分布

D：在任何分布下产生错误的概率都是1/2

1. Introduction

深度学习的目标是用丰富的层次模型（rich, hierarchical models），表达人工智能领域任意种类数据的分布（distribution）。

当前深度学习领域最为成功的，是判别模型（discriminative models），主要成功基于反向传播（backpropagation）和丢弃（dropout）算法。

生成模型（generative models）的成就较少，原因在于计算极大似然估计（maximum likelihood estimation）和相关策略的概率计算困难，以及在生成的上下文中（generative context）很难使用分段线性单元的好处。本文提出了一个新的生成模型来解决这些问题。

这篇文章的生成模型（Generator）和判别模型（Discriminator）都是用多层感知机（multiplayer perceptron, 即全连接层）实现的，用简单有效的反向传播算法和dropout算法就可以训练。不需要近似推理和马尔可夫链。

2. Related work

数学基础不够，看不懂。

3. Adversarial nets

G(z; θg)：多层感知机，可微函数，输入噪音，通过多层感知机参数θg生成。

D(x; θd)：多层感知机，输出一个单独的标量。

训练D：最大化分配正确标签的概率（输入是真实图像和生成图像, training examples and samples from G）。

训练G：最小化 log(1 - D(G(z)))

上述方程无法为G提供足够的梯度来学习，训练初期，G生成的图像很差，D会以高置信度来拒绝生成的样本，因为他们和训练数据明显不同。这个时候，log(1 - D(G(z))) 就会饱和。

因此在训练G的时候，我们选择最大化 log(D(G(z))) 而不是最小化 log(1 - D(G(z))) 。

这样就能在训练初期为G提供较大的梯度。

这里可能不是说的很清楚，原文：This objective function results in the same fixed point of the dynamics of G and D but provides much stronger gradients early in learning.

4. Theoretical Results

5. Experiments

6. Advantages and disadvantages

7. Conclusions and future work

"Generative Adversarial Nets" Notes的更多相关文章

论文笔记之：Conditional Generative Adversarial Nets
Conditional Generative Adversarial Nets arXiv 2014 本文是 GANs 的拓展,在产生和判别时,考虑到额外的条件 y,以进行更加"激烈 ...
（转）Deep Learning Research Review Week 1: Generative Adversarial Nets
Adit Deshpande CS Undergrad at UCLA ('19) Blog About Resume Deep Learning Research Review Week 1: Ge ...
论文笔记之：Generative Adversarial Nets
Generative Adversarial Nets NIPS 2014 摘要:本文通过对抗过程,提出了一种新的框架来预测产生式模型,我们同时训练两个模型:一个产生式模型 G,该模型可以抓住数据分 ...
Generative Adversarial Nets[BEGAN]
本文来自<BEGAN: Boundary Equilibrium Generative Adversarial Networks>,时间线为2017年3月.是google的工作. 作者提出 ...
Generative Adversarial Nets[content]
0. Introduction 基于纳什平衡,零和游戏,最大最小策略等角度来作为GAN的引言 1. GAN GAN开山之作图1.1 GAN的判别器和生成器的结构图及loss 2. Condition ...
Generative Adversarial Nets[CycleGAN]
本文来自<Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks>,时间线为2017 ...
Generative Adversarial Nets[CAAE]
本文来自<Age Progression/Regression by Conditional Adversarial Autoencoder>,时间线为2017年2月. 该文很有意思,是如 ...
Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言本文主要思考的是 ...
Generative Adversarial Nets[Pre-WGAN]
本文来自<towards principled methods for training generative adversarial networks>,时间线为2017年1月,第一作者 ...

随机推荐

AltiumDesigner16笔记
集成库(*.intlib)没有办法直接修改库文件,但是*.schlib可以编辑的. 原理图元件批量修改可以从Tools-> Update from libraries进行. PCB封装批量修改: ...
Android小例子：使用反射机制来读取图片制作一个图片浏览器
效果图: 工程文件夹: 该例子可供于新手参考练习,如果有哪里不对的地方,望指正>-< <黑幕下的人> java代码(MainActivity.java): package co ...
类型“Observable<Response>”上不存在属性“map”
出错提示: angular2 Property 'map' does not exist on type 'Observable<Response>' 类型“Observable<R ...
初学者：__init__.py文件的作用
__init__.py 文件的作用及意义 __init__.py文件是一个包必须的文件,即使它是空的,但也是必须的,如果没有这个文件,python将不会把该文件夹当做一个package,而仅仅是一个d ...
转载自鸿燕藏锋-ETL讲解（很详细！！！）
ETL讲解(很详细!!!) ETL讲解(很详细!!!) ETL是将业务系统的数据经过抽取.清洗转换之后加载到数据仓库的过程,目的是将企业中的分散.零乱.标准不统一的数据整合到一起,为企业的决策提供 ...
VSCode 配置 Python
假设 Anaconda 和 VSCode 都安装好了. 安装插件 VSCode 自带的 python 高亮不是很好,这里我们用 One Dark Pro 插件, 以及安装 Python 插件. 设定 ...
ruby中url解码并替换非法字符
url中中文字符解码 str = URI.decode(url_str) 替换非法字符 if ! str.valid_encoding? p str = str.encode("UTF-16 ...
char[] 转换string时的自动截断问题
在char[] 转换string时可以直接转换,但当用char[]读取一个二进制文件之后,若char[] 中包含有'\0'时,在转换时会被string检测到并认为字符串末尾,后面内容会被截断,导致转换 ...
C# 面试题（三）
1. 抽象类的特性是什么? 抽象类不能被实力化,在抽象类上使用new操作符是错误的. 抽象类允许(但不必要)包含抽象方法和入口. 抽象类不能用scaled修饰符. 2. abstract关键字怎么用? ...
北京Uber优步司机奖励政策（3月10日）
滴快车单单2.5倍,注册地址:http://www.udache.com/ 如何注册Uber司机(全国版最新最详细注册流程)/月入2万/不用抢单:http://www.cnblogs.com/mfry ...