学习GAN必须阅读的10篇论文
本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(pytorch)系列教程
生成对抗网络是深度学习中最有趣和最受欢迎的应用之一。本文将列出 10 篇关于 GAN 的论文,这些论文详细介绍了 GAN,以及了解最新技术的基础。
目录:
- DCGAN
- Improved Techniques for Training GANs
- Conditional GANs
- Progressively Growing GANs
- BigGAN
- StyleGAN
- CycleGAN
- Pix2Pix
- StackGAN
- Generative Adversarial Networks
DCGANs (2015)
建议使用 DCGAN 开启您的 GAN 之旅。这篇论文展示了卷积层与 GAN 是怎样组合的,还提供了其他一系列其他的参考架构。论文还讨论了诸如可视化GAN特征,潜在空间插值,用鉴别器特征训练分类器,结果评价等方面,这些方面都会出现在您的 GAN 研究中。总之,DCGAN 论文是必读的 GAN 论文,因为它的结构非常清晰,代码容易使用,可以马上用在您的 GAN 开发中。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LQlUDJmz-1570281194924)(http://qiniu.huizhoujj.cn/1_2NFOGSwW8XCZfMzu2gz-DA.png)]
地址(https://arxiv.org/abs/1511.06434)
Improved Techniques for Training GANs (2016)
这篇论文(作者包括了Ian Goodfellow)提供了一系列的建议,用来建立DCGAN论文中提出的网络结构。这篇论文会帮助您理解GAN不稳定性的最佳假设。此外,本文还提出了许多稳定DCGAN训练的其他技术,包括特征匹配,小批量识别,历史平均,单面标签平滑和虚拟批量标准化。通过这些可以建立一个简单的DCGAN,是一个不错的经历,可帮助更好地理解GAN。
地址(https://arxiv.org/abs/1606.03498)
Conditional GANs (2014)
这是一篇很好的论文。Conditional GANs 是最先进的GAN的核心主题。这篇论文展示了如何整合数据的标签,从而实现更稳定的GAN训练。这种使用先验信息调节GAN的概念在GAN研究的未来工作中是一个反复出现的主题,对于关注图像到图像或文本到图像的论文尤其重要。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IQDSffpd-1570281194924)(http://qiniu.huizhoujj.cn/1_bDTxgALN7bRXMOMSXXfCCA.png)]
地址(https://arxiv.org/abs/1411.1784)
Progressively Growing of GANs for Improved Quality, Stability, and Variation (2017)
由于其令人印象深刻的结果和对GAN问题的创造性方法,这篇论文是必须要阅读一下的。它采用不同层次结构,GAN 分辨率从4²到8²,最高到1024²。相对于目标图像分辨率大小,GAN的不稳定性大大增加,本文就提出了该问题的解决方法。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0tk0qzux-1570281194925)(http://qiniu.huizhoujj.cn/1_-yWq7Pps_0wzRcM-tMOBfQ.png)]
地址(https://arxiv.org/abs/1710.10196)
BigGAN (2019)
BigGAN模型是ImageNet的当前最新技术。这种模型很难在本地机器上实现,并且模型中有许多组件,如自注意力,频谱归一化和带有投影鉴别器的cGAN,这些都在他们的论文中得到了很好的解释。而且论文对当前最新技术的基础论文进行了全面的概述。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-keFu1KRW-1570281194926)(http://qiniu.huizhoujj.cn/1_Sxmw8DbslfqgBVuFe2sUuA.png)]
地址(https://arxiv.org/abs/1809.11096)
StyleGAN (2019)
StyleGAN模型可以说在这方面是最好的,尤其是在隐空间控制中。该模型使用称为自适应实例归一化(AdaIN)的神经风格转移机制来控制隐空间向量z,而不像之前的其他方式。映射网络和AdaIN训练分布在整个生成器模型中的的组合使得自己很难实现,但它仍然值得阅读,它包含了许多有趣的想法。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aJJcJmTI-1570281194926)(http://qiniu.huizhoujj.cn/1_ZXDIjsL3c8y1q53AOPjwQw.png)]
地址(https://arxiv.org/abs/1812.04948)
CycleGAN (2017)
CycleGAN论文与前面提到的6篇论文不同,因为它讨论了图像到图像的迁移问题而不是随机向量的图像合成问题。CycleGAN可以更具体地处理没有配对的图像转换的训练样本。因为循环一致性损失公式的优雅以及如何稳定GAN训练的方式,这是一篇值得阅读的论文。有许多有趣的程序使用CycleGAN,例如超分辨率,风格迁移,让马变为斑马。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0XkipXzN-1570281194926)(http://qiniu.huizhoujj.cn/1_bzUSPC5h6I7QdMgdJD85Pg.png)]
地址(https://arxiv.org/abs/1703.10593)
Pix2Pix (2016)
Pix2Pix是另一种图像到图像转换的GAN模型。该框架使用配对的训练样本,并在GAN模型中使用许多不同的配置。阅读本文时,对我来说最有趣的事情之一就是对PatchGAN的讨论。PatchGAN观察图像的70 x 70区域,以确定它们是真实的还是虚假的,而不是查看整个图像。该模型还提出了一个有趣的U-Net风格生成器结构,以及在生成器模型中使用ResNet样式的跳跃连接。有许多很酷的应用,例如边缘图到照片般真实的图像。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C7NZrRCC-1570281194927)(http://qiniu.huizhoujj.cn/1_hE0JuFziPLUo-sc1eG0RbA.png)]
地址(https://arxiv.org/abs/1611.07004)
StackGAN (2017)
StackGAN论文与先前的论文相比非常独特。它非常类似于Conditional GANs和Progressively Growing GANs。StackGAN模型的工作方式类似于Progressively Growing GANs,因为它可以在多尺度上工作。StackGAN首先输出64 * 64的图像,然后将其作为先验信息生成256 * 256的图像。StackGAN非常独特,因为它是从自然语言文本到图像的转换。这是通过改变文本嵌入来实现的,以便得到视觉特征。这是一篇非常有趣的论文,看到StyleGAN中展示的潜在空间控制与StackGAN中定义的自然语言接口相结合,令人惊叹。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wf1X7Yjd-1570281194927)(http://qiniu.huizhoujj.cn/1_J0gBWPmkvHgrG75cZiE-0g.png)]
地址(https://arxiv.org/abs/1612.03242)
Generative Adversarial Networks (2014)
Ian Goodfellow的原论文对任何研究GAN的人来说都是必读的。本文定义了GAN框架并讨论了“非饱和”损失函数。本文还给出了最优鉴别器的推导,这是最近GAN论文中经常出现的证明。本文还证明了GAN在实验中对MNIST,TFD和CIFAR-10图像数据集的有效性。
地址(https://arxiv.org/abs/1406.2661)
本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(Pytorch)系列教程
学习GAN必须阅读的10篇论文的更多相关文章
- 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台
美国时间2月7-12日,AAAI 2020大会在纽约正式拉开序幕,AAAI作为全球人工智能领域的顶级学术会议,每年评审并收录来自全球最顶尖的学术论文,这些学术研究引领着技术的趋势和未来.京东云与AI在 ...
- ICML 2018 | 从强化学习到生成模型:40篇值得一读的论文
https://blog.csdn.net/y80gDg1/article/details/81463731 感谢阅读腾讯AI Lab微信号第34篇文章.当地时间 7 月 10-15 日,第 35 届 ...
- zz2019年主动学习有哪些进展?答案在这三篇论文里
2019年主动学习有哪些进展?答案在这三篇论文里 目前推广应用的机器学习方法或模型主要解决分类问题,即给定一组数据(文本.图像.视频等),判断数据类别或将同类数据归类等,训练过程依赖于已标注类别的训练 ...
- How to Read a Paper丨如何阅读一篇论文
这是我在看论文时无意刷到的博客推荐的一篇文章"How to Read a Paper",教你怎么样看论文.对于研究生来说,看论文基本是日常,一篇论文十多二十页,如何高效地读论文确实 ...
- 转:关于Python中的lambda,这篇阅读量10万+的文章可能是你见过的最完整的讲解
lambda是Python编程语言中使用频率较高的一个关键字.那么,什么是lambda?它有哪些用法?网上的文章汗牛充栋,可是把这个讲透的文章却不多.这里,我们通过阅读各方资料,总结了关于Python ...
- 网易云安全两篇论文入选计算机视觉顶级会议ICCV
本文由 网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...
- PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)
100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...
- jQuery学习笔记 - 基础知识扫盲入门篇
jQuery学习笔记 - 基础知识扫盲入门篇 2013-06-16 18:42 by 全新时代, 11 阅读, 0 评论, 收藏, 编辑 1.为什么要使用jQuery? 提供了强大的功能函数解决浏览器 ...
- (zhuan) 深度学习全网最全学习资料汇总之模型介绍篇
This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058& ...
随机推荐
- Spring源码阅读笔记03:xml配置读取
前面的文章介绍了IOC的概念,Spring提供的bean容器即是对这一思想的具体实现,在接下来的几篇文章会侧重于探究这一bean容器是如何实现的.在此之前,先用一段话概括一下bean容器的基本工作原理 ...
- 一文看懂Java序列化
一文看懂Java序列化 简介 Java实现 Serializable 最基本情况 类的成员为引用 同一对象多次序列化 子父类引用序列化 可自定义的可序列化 Externalizable:强制自定义序列 ...
- 使用timeit测试Python函数的性能
timeit是Python标准库内置的小工具,可以快速测试小段代码的性能. 认识timeit timeit 函数: timeit.timeit(stmt, setup,timer, number) 参 ...
- EventEmitter:从命令式 JavaScript class 到声明函数式的华丽转身
新书终于截稿,今天稍有空闲,为大家奉献一篇关于 JavaScript 语言风格的文章,主角是函数声明式. 灵活的 JavaScript 及其 multiparadigm 相信"函数式&quo ...
- 逐浪web无障碍与国际化以及全民族语言支持白皮书
北京时间2019年5月10日,领先的门户网站与WEB内核服务厂商--上海Zoomla!逐浪CMS团队发布其年度重榜产品:逐浪CMS全民族语言与国际版,体验站点:http://demo2.z01.com ...
- Markdown中插入复杂的合并表格方法
由于Markdown自身的语法限制,不能直接插入有合并单元格的复杂表格. 姓名 学号 专业 张三 2018123456 计算机 赵四 2018222356 自动化 李六 2018666666 信息工程 ...
- flask 模型之间的关系 操作注意点
在创建模型时使用 # 关联表与表 添加以下参数 lazy='dynamic' 在两个表之间使用关联字段可以再次进行操作,筛选,分页 具体操作请看 https://www.bilibili.com/ ...
- 用python实现LBP特征点计算
import cv2 import numpy as np def olbp(src): dst = np.zeros(src.shape,dtype=src.dtype) for i in rang ...
- mybatis深入之动态查询和连接池介绍
mybatis深入之动态查询和连接池介绍 一.mybatis条件查询 在mybatis前述案例中,我们的查询条件都是确定的.但在实际使用的时候,我们的查询条件有可能是动态变化的.例如,查询参数为一个u ...
- PageRank 算法初步了解
前言 因为想做一下文本自动摘要,文本自动摘要是NLP的重要应用,搜了一下,有一种TextRank的算法,可以做文本自动摘要.其算法思想来源于Google的PageRank,所以先把PageRank给了 ...