学习GAN必须阅读的10篇论文
本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(pytorch)系列教程
生成对抗网络是深度学习中最有趣和最受欢迎的应用之一。本文将列出 10 篇关于 GAN 的论文,这些论文详细介绍了 GAN,以及了解最新技术的基础。
目录:
- DCGAN
- Improved Techniques for Training GANs
- Conditional GANs
- Progressively Growing GANs
- BigGAN
- StyleGAN
- CycleGAN
- Pix2Pix
- StackGAN
- Generative Adversarial Networks
DCGANs (2015)
建议使用 DCGAN 开启您的 GAN 之旅。这篇论文展示了卷积层与 GAN 是怎样组合的,还提供了其他一系列其他的参考架构。论文还讨论了诸如可视化GAN特征,潜在空间插值,用鉴别器特征训练分类器,结果评价等方面,这些方面都会出现在您的 GAN 研究中。总之,DCGAN 论文是必读的 GAN 论文,因为它的结构非常清晰,代码容易使用,可以马上用在您的 GAN 开发中。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LQlUDJmz-1570281194924)(http://qiniu.huizhoujj.cn/1_2NFOGSwW8XCZfMzu2gz-DA.png)]
地址(https://arxiv.org/abs/1511.06434)
Improved Techniques for Training GANs (2016)
这篇论文(作者包括了Ian Goodfellow)提供了一系列的建议,用来建立DCGAN论文中提出的网络结构。这篇论文会帮助您理解GAN不稳定性的最佳假设。此外,本文还提出了许多稳定DCGAN训练的其他技术,包括特征匹配,小批量识别,历史平均,单面标签平滑和虚拟批量标准化。通过这些可以建立一个简单的DCGAN,是一个不错的经历,可帮助更好地理解GAN。
地址(https://arxiv.org/abs/1606.03498)
Conditional GANs (2014)
这是一篇很好的论文。Conditional GANs 是最先进的GAN的核心主题。这篇论文展示了如何整合数据的标签,从而实现更稳定的GAN训练。这种使用先验信息调节GAN的概念在GAN研究的未来工作中是一个反复出现的主题,对于关注图像到图像或文本到图像的论文尤其重要。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IQDSffpd-1570281194924)(http://qiniu.huizhoujj.cn/1_bDTxgALN7bRXMOMSXXfCCA.png)]
地址(https://arxiv.org/abs/1411.1784)
Progressively Growing of GANs for Improved Quality, Stability, and Variation (2017)
由于其令人印象深刻的结果和对GAN问题的创造性方法,这篇论文是必须要阅读一下的。它采用不同层次结构,GAN 分辨率从4²到8²,最高到1024²。相对于目标图像分辨率大小,GAN的不稳定性大大增加,本文就提出了该问题的解决方法。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0tk0qzux-1570281194925)(http://qiniu.huizhoujj.cn/1_-yWq7Pps_0wzRcM-tMOBfQ.png)]
地址(https://arxiv.org/abs/1710.10196)
BigGAN (2019)
BigGAN模型是ImageNet的当前最新技术。这种模型很难在本地机器上实现,并且模型中有许多组件,如自注意力,频谱归一化和带有投影鉴别器的cGAN,这些都在他们的论文中得到了很好的解释。而且论文对当前最新技术的基础论文进行了全面的概述。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-keFu1KRW-1570281194926)(http://qiniu.huizhoujj.cn/1_Sxmw8DbslfqgBVuFe2sUuA.png)]
地址(https://arxiv.org/abs/1809.11096)
StyleGAN (2019)
StyleGAN模型可以说在这方面是最好的,尤其是在隐空间控制中。该模型使用称为自适应实例归一化(AdaIN)的神经风格转移机制来控制隐空间向量z,而不像之前的其他方式。映射网络和AdaIN训练分布在整个生成器模型中的的组合使得自己很难实现,但它仍然值得阅读,它包含了许多有趣的想法。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aJJcJmTI-1570281194926)(http://qiniu.huizhoujj.cn/1_ZXDIjsL3c8y1q53AOPjwQw.png)]
地址(https://arxiv.org/abs/1812.04948)
CycleGAN (2017)
CycleGAN论文与前面提到的6篇论文不同,因为它讨论了图像到图像的迁移问题而不是随机向量的图像合成问题。CycleGAN可以更具体地处理没有配对的图像转换的训练样本。因为循环一致性损失公式的优雅以及如何稳定GAN训练的方式,这是一篇值得阅读的论文。有许多有趣的程序使用CycleGAN,例如超分辨率,风格迁移,让马变为斑马。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0XkipXzN-1570281194926)(http://qiniu.huizhoujj.cn/1_bzUSPC5h6I7QdMgdJD85Pg.png)]
地址(https://arxiv.org/abs/1703.10593)
Pix2Pix (2016)
Pix2Pix是另一种图像到图像转换的GAN模型。该框架使用配对的训练样本,并在GAN模型中使用许多不同的配置。阅读本文时,对我来说最有趣的事情之一就是对PatchGAN的讨论。PatchGAN观察图像的70 x 70区域,以确定它们是真实的还是虚假的,而不是查看整个图像。该模型还提出了一个有趣的U-Net风格生成器结构,以及在生成器模型中使用ResNet样式的跳跃连接。有许多很酷的应用,例如边缘图到照片般真实的图像。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C7NZrRCC-1570281194927)(http://qiniu.huizhoujj.cn/1_hE0JuFziPLUo-sc1eG0RbA.png)]
地址(https://arxiv.org/abs/1611.07004)
StackGAN (2017)
StackGAN论文与先前的论文相比非常独特。它非常类似于Conditional GANs和Progressively Growing GANs。StackGAN模型的工作方式类似于Progressively Growing GANs,因为它可以在多尺度上工作。StackGAN首先输出64 * 64的图像,然后将其作为先验信息生成256 * 256的图像。StackGAN非常独特,因为它是从自然语言文本到图像的转换。这是通过改变文本嵌入来实现的,以便得到视觉特征。这是一篇非常有趣的论文,看到StyleGAN中展示的潜在空间控制与StackGAN中定义的自然语言接口相结合,令人惊叹。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wf1X7Yjd-1570281194927)(http://qiniu.huizhoujj.cn/1_J0gBWPmkvHgrG75cZiE-0g.png)]
地址(https://arxiv.org/abs/1612.03242)
Generative Adversarial Networks (2014)
Ian Goodfellow的原论文对任何研究GAN的人来说都是必读的。本文定义了GAN框架并讨论了“非饱和”损失函数。本文还给出了最优鉴别器的推导,这是最近GAN论文中经常出现的证明。本文还证明了GAN在实验中对MNIST,TFD和CIFAR-10图像数据集的有效性。
地址(https://arxiv.org/abs/1406.2661)
本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(Pytorch)系列教程
学习GAN必须阅读的10篇论文的更多相关文章
- 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台
美国时间2月7-12日,AAAI 2020大会在纽约正式拉开序幕,AAAI作为全球人工智能领域的顶级学术会议,每年评审并收录来自全球最顶尖的学术论文,这些学术研究引领着技术的趋势和未来.京东云与AI在 ...
- ICML 2018 | 从强化学习到生成模型:40篇值得一读的论文
https://blog.csdn.net/y80gDg1/article/details/81463731 感谢阅读腾讯AI Lab微信号第34篇文章.当地时间 7 月 10-15 日,第 35 届 ...
- zz2019年主动学习有哪些进展?答案在这三篇论文里
2019年主动学习有哪些进展?答案在这三篇论文里 目前推广应用的机器学习方法或模型主要解决分类问题,即给定一组数据(文本.图像.视频等),判断数据类别或将同类数据归类等,训练过程依赖于已标注类别的训练 ...
- How to Read a Paper丨如何阅读一篇论文
这是我在看论文时无意刷到的博客推荐的一篇文章"How to Read a Paper",教你怎么样看论文.对于研究生来说,看论文基本是日常,一篇论文十多二十页,如何高效地读论文确实 ...
- 转:关于Python中的lambda,这篇阅读量10万+的文章可能是你见过的最完整的讲解
lambda是Python编程语言中使用频率较高的一个关键字.那么,什么是lambda?它有哪些用法?网上的文章汗牛充栋,可是把这个讲透的文章却不多.这里,我们通过阅读各方资料,总结了关于Python ...
- 网易云安全两篇论文入选计算机视觉顶级会议ICCV
本文由 网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...
- PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)
100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...
- jQuery学习笔记 - 基础知识扫盲入门篇
jQuery学习笔记 - 基础知识扫盲入门篇 2013-06-16 18:42 by 全新时代, 11 阅读, 0 评论, 收藏, 编辑 1.为什么要使用jQuery? 提供了强大的功能函数解决浏览器 ...
- (zhuan) 深度学习全网最全学习资料汇总之模型介绍篇
This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058& ...
随机推荐
- 最近做的一个Spring Boot小项目,欢迎大家访问 http://39.97.115.152/
最近做的一个Spring Boot小项目,欢迎大家访问 http://39.97.115.152/,帮忙找找bug,网站里有源码地址 网站说明 甲壳虫社区(Beetle Community) 一个开源 ...
- dubbo与trivial超时机制的深入思考
说在前面 trivial是根据之前设计的RPC框架而来的(还在增进当中),其中较为不同的一个点为,在客户端去掉了业务线程池,因为既然都要等待,不必要再加一层. 进入正题 有在网上看到这样的信息,“之前 ...
- Day 3 DP
1. P1015 精卫填海 01背包 + 判断 #include <iostream> using namespace std; , MAXV = ; int v, n, m, f[MAX ...
- Java设计模式二
今天谈的是工厂模式,该模式用于封装和对对象的创建,万物皆对象,那么万物又是产品类,如一个水果厂生产三种水果罐头,我们就可以将这三种水果作为产品类,再定义一个接口用来设定对水果罐头的生成方法,在工厂类中 ...
- 【Geek议题】当年那些风骚的跨域操作
前言 现在cross-origin resource sharing(跨域资源共享,下简称CORS)已经十分普及,算上IE8的不标准兼容(XDomainRequest),各大浏览器基本都已支持,当年为 ...
- 全面认识HBase架构(建议收藏)
在网上看过很多HBaes架构相关的文章,内容深浅不一,直到发现了一篇MapR官网的文章https://mapr.com/blog/in-depth-look-hbase-architecture/#. ...
- A. New Building for SIS Codeforce
You are looking at the floor plan of the Summer Informatics School's new building. You were tasked w ...
- 备份Oracl数据库.bat
=========================== @echo off echo ================================================ echo Win ...
- NoVNC API 文档翻译
原文地址:https://github.com/novnc/noVNC/blob/master/docs/API.md 时间:2019-05-21 noVNC API The interfac ...
- C++ 文件操作 FILE*
#define _CRT_SECURE_NO_WARNINGS #include <stdio.h> //编程题:往文件里写入字母表的26个字母. //要求:如果字母对应编码值 是奇数则写 ...