"Generative Adversarial Nets" Notes
- Ian J.Goodfellow
中文翻译:https://blog.csdn.net/wspba/article/details/54577236
代码实现:https://github.com/devnag/pytorch-generative-adversarial-networks/blob/master/gan_pytorch.py
Abstract
G:恢复训练样本的分布
D:在任何分布下产生错误的概率都是1/2
1. Introduction
深度学习的目标是用丰富的层次模型(rich, hierarchical models),表达人工智能领域任意种类数据的分布(distribution)。
当前深度学习领域最为成功的,是判别模型(discriminative models),主要成功基于反向传播(backpropagation)和丢弃(dropout)算法。
生成模型(generative models)的成就较少,原因在于计算极大似然估计(maximum likelihood estimation)和相关策略的概率计算困难,以及在生成的上下文中(generative context)很难使用分段线性单元的好处。本文提出了一个新的生成模型来解决这些问题。
这篇文章的生成模型(Generator)和判别模型(Discriminator)都是用多层感知机(multiplayer perceptron, 即全连接层)实现的,用简单有效的反向传播算法和dropout算法就可以训练。不需要近似推理和马尔可夫链。
2. Related work
数学基础不够,看不懂。
3. Adversarial nets
G(z; θg):多层感知机,可微函数,输入噪音,通过多层感知机参数θg生成。
D(x; θd):多层感知机,输出一个单独的标量。
训练D:最大化分配正确标签的概率(输入是真实图像和生成图像, training examples and samples from G)。
训练G:最小化 log(1 - D(G(z)))
上述方程无法为G提供足够的梯度来学习,训练初期,G生成的图像很差,D会以高置信度来拒绝生成的样本,因为他们和训练数据明显不同。这个时候,log(1 - D(G(z))) 就会饱和。
因此在训练G的时候,我们选择最大化 log(D(G(z))) 而不是最小化 log(1 - D(G(z))) 。
这样就能在训练初期为G提供较大的梯度。
这里可能不是说的很清楚,原文:This objective function results in the same fixed point of the dynamics of G and D but provides much stronger gradients early in learning.
4. Theoretical Results
5. Experiments
6. Advantages and disadvantages
7. Conclusions and future work
"Generative Adversarial Nets" Notes的更多相关文章
- 论文笔记之:Conditional Generative Adversarial Nets
Conditional Generative Adversarial Nets arXiv 2014 本文是 GANs 的拓展,在产生 和 判别时,考虑到额外的条件 y,以进行更加"激烈 ...
- (转)Deep Learning Research Review Week 1: Generative Adversarial Nets
Adit Deshpande CS Undergrad at UCLA ('19) Blog About Resume Deep Learning Research Review Week 1: Ge ...
- 论文笔记之:Generative Adversarial Nets
Generative Adversarial Nets NIPS 2014 摘要:本文通过对抗过程,提出了一种新的框架来预测产生式模型,我们同时训练两个模型:一个产生式模型 G,该模型可以抓住数据分 ...
- Generative Adversarial Nets[BEGAN]
本文来自<BEGAN: Boundary Equilibrium Generative Adversarial Networks>,时间线为2017年3月.是google的工作. 作者提出 ...
- Generative Adversarial Nets[content]
0. Introduction 基于纳什平衡,零和游戏,最大最小策略等角度来作为GAN的引言 1. GAN GAN开山之作 图1.1 GAN的判别器和生成器的结构图及loss 2. Condition ...
- Generative Adversarial Nets[CycleGAN]
本文来自<Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks>,时间线为2017 ...
- Generative Adversarial Nets[CAAE]
本文来自<Age Progression/Regression by Conditional Adversarial Autoencoder>,时间线为2017年2月. 该文很有意思,是如 ...
- Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言 本文主要思考的是 ...
- Generative Adversarial Nets[Pre-WGAN]
本文来自<towards principled methods for training generative adversarial networks>,时间线为2017年1月,第一作者 ...
随机推荐
- Process.waitFor()导致主线程堵塞问题
今日开发的时候使用jdk自带的运行时变量 RunTime.getRunTime() 去执行bash命令.因为该bash操作耗时比较长,所以使用了Process.waitFor()去等待子线程运行结束. ...
- Oracle以固定字符截取字符串
CREATE OR REPLACE FUNCTION "F_SPLIT" (p_str IN CLOB, p_delimiter IN VARCHAR2) RETURN ty_st ...
- 工具 | Axure基础操作 No.3
下午了,再来补一些学习,今天东西不多哦,感觉慢慢上手了. 1.设置元件禁用状态 2.设置单选按钮唯一选中 注意这里在浏览器中就只能唯一选中了. 3.设置图片上的文字 4.图片的切割和裁剪 5.嵌入多媒 ...
- GPUImage源码解读之GPUImageFramebuffer
简介 OpenGL ES的FrameBuffer是渲染发生的地方,普通的2D图形的渲染默认发生在屏幕上:而三维的图形渲染则除了包括像素点的颜色,还有Depth Buffer,Stencil Buffe ...
- es6 Set 和Map 数据结构
ES6提供了新的数据结构Set,它类似于数组,但是成员的值都是唯一的,没有重复的值. Set 本身是一个数据结构,用来生成Set 数据结构. const s = new Set(); [2,3,5,4 ...
- NodeJs仿阿帕奇实现浏览某一路径文件目录效果
网页效果 这里实现的效果是将我的电脑下的某一路径文件展现在网页中 html网页代码: <h1>仿阿帕奇网页 </h1> <table> <tr> < ...
- chromium之task
// A task is a generic runnable thingy, usually used for running code on a // different thread or fo ...
- ABAP开发顾问必备:SAP ABAP开发技术总结[转载]
转载自SAP师太技术博客,原文链接:http://www.cnblogs.com/jiangzhengjun/p/4260224.html 在原文上增加了链接,此文及此文的链接版权都归SAP师太所有. ...
- npm 取消代理 npm config delete proxy
今天在安装electron时设置了代理,发现再npm install 安装别的总是装不上,只好取消代理. npm 取消代理 npm config delete proxy
- c语言中:strlen和sizeof的区别和它们分别交换各自作用领域(\0问题)时的细微差别!!!
本人c语言初学菜鸟一枚,今天通过敲了一段简单代码,发现strlen和sizeof之间的一些关系,总结如下: 用strlen计算数组长度要考虑进去\0 用sizeof计算字符串长度也要考虑进去\0 而s ...