本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(pytorch)系列教程

生成对抗网络是深度学习中最有趣和最受欢迎的应用之一。本文将列出 10 篇关于 GAN 的论文,这些论文详细介绍了 GAN,以及了解最新技术的基础。

目录:

  1. DCGAN
  2. Improved Techniques for Training GANs
  3. Conditional GANs
  4. Progressively Growing GANs
  5. BigGAN
  6. StyleGAN
  7. CycleGAN
  8. Pix2Pix
  9. StackGAN
  10. Generative Adversarial Networks

DCGANs (2015)

建议使用 DCGAN 开启您的 GAN 之旅。这篇论文展示了卷积层与 GAN 是怎样组合的,还提供了其他一系列其他的参考架构。论文还讨论了诸如可视化GAN特征,潜在空间插值,用鉴别器特征训练分类器,结果评价等方面,这些方面都会出现在您的 GAN 研究中。总之,DCGAN 论文是必读的 GAN 论文,因为它的结构非常清晰,代码容易使用,可以马上用在您的 GAN 开发中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LQlUDJmz-1570281194924)(http://qiniu.huizhoujj.cn/1_2NFOGSwW8XCZfMzu2gz-DA.png)]

地址(https://arxiv.org/abs/1511.06434)

Improved Techniques for Training GANs (2016)

这篇论文(作者包括了Ian Goodfellow)提供了一系列的建议,用来建立DCGAN论文中提出的网络结构。这篇论文会帮助您理解GAN不稳定性的最佳假设。此外,本文还提出了许多稳定DCGAN训练的其他技术,包括特征匹配,小批量识别,历史平均,单面标签平滑和虚拟批量标准化。通过这些可以建立一个简单的DCGAN,是一个不错的经历,可帮助更好地理解GAN。

地址(https://arxiv.org/abs/1606.03498)

Conditional GANs (2014)

这是一篇很好的论文。Conditional GANs 是最先进的GAN的核心主题。这篇论文展示了如何整合数据的标签,从而实现更稳定的GAN训练。这种使用先验信息调节GAN的概念在GAN研究的未来工作中是一个反复出现的主题,对于关注图像到图像或文本到图像的论文尤其重要。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IQDSffpd-1570281194924)(http://qiniu.huizhoujj.cn/1_bDTxgALN7bRXMOMSXXfCCA.png)]

地址(https://arxiv.org/abs/1411.1784)

Progressively Growing of GANs for Improved Quality, Stability, and Variation (2017)

由于其令人印象深刻的结果和对GAN问题的创造性方法,这篇论文是必须要阅读一下的。它采用不同层次结构,GAN 分辨率从4²到8²,最高到1024²。相对于目标图像分辨率大小,GAN的不稳定性大大增加,本文就提出了该问题的解决方法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0tk0qzux-1570281194925)(http://qiniu.huizhoujj.cn/1_-yWq7Pps_0wzRcM-tMOBfQ.png)]

地址(https://arxiv.org/abs/1710.10196)

BigGAN (2019)

BigGAN模型是ImageNet的当前最新技术。这种模型很难在本地机器上实现,并且模型中有许多组件,如自注意力,频谱归一化和带有投影鉴别器的cGAN,这些都在他们的论文中得到了很好的解释。而且论文对当前最新技术的基础论文进行了全面的概述。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-keFu1KRW-1570281194926)(http://qiniu.huizhoujj.cn/1_Sxmw8DbslfqgBVuFe2sUuA.png)]

地址(https://arxiv.org/abs/1809.11096)

StyleGAN (2019)

StyleGAN模型可以说在这方面是最好的,尤其是在隐空间控制中。该模型使用称为自适应实例归一化(AdaIN)的神经风格转移机制来控制隐空间向量z,而不像之前的其他方式。映射网络和AdaIN训练分布在整个生成器模型中的的组合使得自己很难实现,但它仍然值得阅读,它包含了许多有趣的想法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aJJcJmTI-1570281194926)(http://qiniu.huizhoujj.cn/1_ZXDIjsL3c8y1q53AOPjwQw.png)]

地址(https://arxiv.org/abs/1812.04948)

CycleGAN (2017)

CycleGAN论文与前面提到的6篇论文不同,因为它讨论了图像到图像的迁移问题而不是随机向量的图像合成问题。CycleGAN可以更具体地处理没有配对的图像转换的训练样本。因为循环一致性损失公式的优雅以及如何稳定GAN训练的方式,这是一篇值得阅读的论文。有许多有趣的程序使用CycleGAN,例如超分辨率,风格迁移,让马变为斑马。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0XkipXzN-1570281194926)(http://qiniu.huizhoujj.cn/1_bzUSPC5h6I7QdMgdJD85Pg.png)]

地址(https://arxiv.org/abs/1703.10593)

Pix2Pix (2016)

Pix2Pix是另一种图像到图像转换的GAN模型。该框架使用配对的训练样本,并在GAN模型中使用许多不同的配置。阅读本文时,对我来说最有趣的事情之一就是对PatchGAN的讨论。PatchGAN观察图像的70 x 70区域,以确定它们是真实的还是虚假的,而不是查看整个图像。该模型还提出了一个有趣的U-Net风格生成器结构,以及在生成器模型中使用ResNet样式的跳跃连接。有许多很酷的应用,例如边缘图到照片般真实的图像。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C7NZrRCC-1570281194927)(http://qiniu.huizhoujj.cn/1_hE0JuFziPLUo-sc1eG0RbA.png)]

地址(https://arxiv.org/abs/1611.07004)

StackGAN (2017)

StackGAN论文与先前的论文相比非常独特。它非常类似于Conditional GANs和Progressively Growing GANs。StackGAN模型的工作方式类似于Progressively Growing GANs,因为它可以在多尺度上工作。StackGAN首先输出64 * 64的图像,然后将其作为先验信息生成256 * 256的图像。StackGAN非常独特,因为它是从自然语言文本到图像的转换。这是通过改变文本嵌入来实现的,以便得到视觉特征。这是一篇非常有趣的论文,看到StyleGAN中展示的潜在空间控制与StackGAN中定义的自然语言接口相结合,令人惊叹。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wf1X7Yjd-1570281194927)(http://qiniu.huizhoujj.cn/1_J0gBWPmkvHgrG75cZiE-0g.png)]

地址(https://arxiv.org/abs/1612.03242)

Generative Adversarial Networks (2014)

Ian Goodfellow的原论文对任何研究GAN的人来说都是必读的。本文定义了GAN框架并讨论了“非饱和”损失函数。本文还给出了最优鉴别器的推导,这是最近GAN论文中经常出现的证明。本文还证明了GAN在实验中对MNIST,TFD和CIFAR-10图像数据集的有效性。

地址(https://arxiv.org/abs/1406.2661)

本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(Pytorch)系列教程

学习GAN必须阅读的10篇论文的更多相关文章

  1. 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台

    美国时间2月7-12日,AAAI 2020大会在纽约正式拉开序幕,AAAI作为全球人工智能领域的顶级学术会议,每年评审并收录来自全球最顶尖的学术论文,这些学术研究引领着技术的趋势和未来.京东云与AI在 ...

  2. ICML 2018 | 从强化学习到生成模型:40篇值得一读的论文

    https://blog.csdn.net/y80gDg1/article/details/81463731 感谢阅读腾讯AI Lab微信号第34篇文章.当地时间 7 月 10-15 日,第 35 届 ...

  3. zz2019年主动学习有哪些进展?答案在这三篇论文里

    2019年主动学习有哪些进展?答案在这三篇论文里 目前推广应用的机器学习方法或模型主要解决分类问题,即给定一组数据(文本.图像.视频等),判断数据类别或将同类数据归类等,训练过程依赖于已标注类别的训练 ...

  4. How to Read a Paper丨如何阅读一篇论文

    这是我在看论文时无意刷到的博客推荐的一篇文章"How to Read a Paper",教你怎么样看论文.对于研究生来说,看论文基本是日常,一篇论文十多二十页,如何高效地读论文确实 ...

  5. 转:关于Python中的lambda,这篇阅读量10万+的文章可能是你见过的最完整的讲解

    lambda是Python编程语言中使用频率较高的一个关键字.那么,什么是lambda?它有哪些用法?网上的文章汗牛充栋,可是把这个讲透的文章却不多.这里,我们通过阅读各方资料,总结了关于Python ...

  6. 网易云安全两篇论文入选计算机视觉顶级会议ICCV

    本文由  网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...

  7. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)

    100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...

  8. jQuery学习笔记 - 基础知识扫盲入门篇

    jQuery学习笔记 - 基础知识扫盲入门篇 2013-06-16 18:42 by 全新时代, 11 阅读, 0 评论, 收藏, 编辑 1.为什么要使用jQuery? 提供了强大的功能函数解决浏览器 ...

  9. (zhuan) 深度学习全网最全学习资料汇总之模型介绍篇

    This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058& ...

随机推荐

  1. marquee上下无缝滚动

    <!DOCTYPE html><html><head><meta charset="utf-8"><meta name=&qu ...

  2. java基础知识点补充---二维数组

    #java基础知识点补充---二维数组 首先定义一个二维数组 int[][] ns={ {1,2,3,4}, {5,6,7,8}, {9,10,11,12}, {13,14,15,16} }; 实现遍 ...

  3. tomcat服务器和http协议笔试题

    tomcat与web程序结构与Http协议与HttpUrlConnection 考查的知识点:tomcat服务器相关信息 1.下面关于tomcat服务器描述正确的是() (难度A) A. tomcat ...

  4. WebAPI-处理架构

    带着问题去思考,大家好! 问题1:HTTP请求和返回相应的HTTP响应信息之间发生了什么? 1:首先是最底层,托管层,位于WebAPI和底层HTTP栈之间 2:其次是 消息处理程序管道层,这里比如日志 ...

  5. CSS的常用单位 %和 vw vh 和 box-sizing:border-box; 和flex简介

    一.% 理解: %号是CSS中的常用单位,它是相对于父容器而言的.如:一个父容器的宽是100px,给它的子元素一个10%,那么子元素的宽就是100px的10% 10px. 效果图: (利用%设置了li ...

  6. 总结:利用asp.net core日志进行生产环境下的错误排查(asp.net core version 2.2,用IIS做服务器)

    概述 调试asp.net core程序时,在输出窗口中,在输出来源选择“调试”或“xxx-ASP.NET Core Web服务器”时,可以看到类似“info:Microsoft.AspNetCore. ...

  7. Spring Boot从入门到精通(七)集成Redis实现Session共享

    单点登录(SSO)是指在多个应用系统中,登录用户只需要登录验证一次就可以访问所有相互信任的应用系统,Redis Session共享是实现单点登录的一种方式.本文是通过Spring Boot框架集成Re ...

  8. spring boot 过滤器 前后端分离跨域sessionId不一致

      import org.springframework.stereotype.Component; import javax.servlet.*; import javax.servlet.http ...

  9. 配置XNA以适用VS2017进行开发

    Win10似乎已不再支持使用XNA进行游戏开发,安装XNA Game Studio经常会出现错误,显示不兼容,即使安装VS2010也不行.下面给出方法,可以使用VS2017配合XNA进行游戏开发. 1 ...

  10. pytest、tox、Jenkins实现python接口自动化持续集成

    pytest介绍 pytest是一款强大的python测试工具,可以胜任各种级别的软件测试工作,可以自动查找测试用并执行,并且有丰富的基础库,可以大幅度提高用户编写测试用例的效率,具备可扩展性,用户自 ...