StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

　　本文将利用 GANs 进行高质量图像生成，分为两个阶段进行，coarse to fine 的过程。据说可以生成 256*256 的高清图像。

　　基于文本生成对应图像的工作已经有了，比如说 Attribute2Image，以及最开始的基于文本生成图像的文章等等。

　　Stacked Generated Adversarial Networks.

　　　　 所涉及到的两个阶段分别为：

　　　　 Stage-I GAN：基于文本描述，我们得到初始的形状，基础的色彩；然后从随机 noise 绘出背景分布，产生低分辨率的图像；

　　　　 Stage-II GAN：通过在此的结合文本描述，进行图像的细致化绘制，产生高质量的 Image。

　　为了缓解条件文本描述 t 产生的高维的 latent space，但是有限的训练数据，可能导致 latent data manifold 的非连续性，

这对于训练产生器来说，可能不是很好。

　　为了解决这个问题，作者引入了条件增强技术来产生更多的条件变量。从一个独立的高斯分布 N 中随机的采样 latent variables，其均值 $\mu$ 和对角协方差矩阵是 text embedding 的函数。所提出的公式可以进一步的提升对小的扰动的鲁棒性，并且在给定少量 image-text pairs 的条件下，产生更多的训练样本。为了进一步的提升平滑性，给产生器的目标函数，添加了一个正则化项：

　　其中，上式就是标准高斯分布和条件高斯分布的 KL-散度。

　　基于高斯条件变量 c0，阶段一的 GAN 迭代的进行两个目标函数的训练：

　　第二个阶段的 GAN 和第一阶段的非常类似。

　　不同的地方，在于产生器不再以 noise Z 作为输入，而是 s0 = G0(z,c0)。

　　虽然整体来说，并没有太多的创新，不过这个实验结果，的确是非常 impressive。

　　启发：　　

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记的更多相关文章

(PatchGANs)Pecomputed Real-time Texture Synthesis With Markovian Generative Adversarial Networks
Introduction: Deconvolution; Computational costs; Strided convolutional nets; Markov patches; 1. Q ...
语音合成论文翻译：2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis
论文地址:MelGAN:条件波形合成的生成对抗网络代码地址:https://github.com/descriptinc/melgan-neurips 音频实例:https://melgan-neu ...
AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks 笔记
AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks 笔记这 ...
《StackGAN: Text to Photo-realistic Image Synthesis with Stacked GAN》论文笔记
出处:arxiv 2016 尚未出版 Motivation 根据文字描述来合成相片级真实感的图片是一项极具挑战性的任务.现有的生成手段,往往只能合成大体的目标,而丢失了生动的细节信息.StackGAN ...
论文笔记之：Generative Adversarial Text to Image Synthesis
Generative Adversarial Text to Image Synthesis ICML 2016 摘要:本文将文本和图像练习起来,根据文本生成图像,结合 CNN 和 GAN 来有效的 ...
Video Frame Synthesis using Deep Voxel Flow 论文笔记
Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...
CSAGAN：LinesToFacePhoto: Face Photo Generation from Lines with Conditional Self-Attention Generative Adversarial Network - 1 - 论文学习
ABSTRACT 在本文中,我们探讨了从线条生成逼真的人脸图像的任务.先前的基于条件生成对抗网络(cGANs)的方法已经证明,当条件图像和输出图像共享对齐良好的结构时,它们能够生成视觉上可信的图像.然 ...
论文笔记：Variational Capsules for Image Analysis and Synthesis
Variational Capsules for Image Analysis and Synthesis 2018-07-16 16:54:36 Paper: https://arxiv.org/ ...
#论文笔记# [pix2pixHD] High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
Ting-Chun Wang, Ming-Yu Liu, Jun-Yan Zhu, Andrew Tao, Jan Kautz, and Bryan Catanzaro. "High-Res ...

随机推荐

iOS thirdKeyboard Develop (APP Extension)
如果需要开发第三方键盘首先得了解一下苹果官方文档 https://developer.apple.com/library/ios/documentation/General/Conceptual/ ...
招聘信息：无线产品研发总监 60-100W
招聘信息:某知名电商公司诚招: 无线产品研发总监 60-100W 招聘人数:1名岗位描述: 熟悉互联网产品业务流程,完成产品功能的概念设计个原型展示: 进行市场调查和分析,相关用户研究和信息整理,提 ...
C# 时间计算今天、昨天、前天、明天一个月的开始日期与结束日期
C# 时间计算今天.昨天.前天.明天 class Program { static void Main(string[] args) { ...
MySQL日期时间函数大全转
DAYOFWEEK(date) 返回日期date是星期几(1=星期天,2=星期一,……7=星期六,ODBC标准)mysql> select DAYOFWEEK('1998-02-03'); ...
U盘又中毒了，隐藏文件如何显示
在开始--运行中输入 cmd ,再输入,attrib -H -S D:\123 /s /d 后回车,你就发现问题解决了.注意命令之间的空格,D:\代表盘符,就是你的移动硬盘的盘符,如果你的盘符是E ...
DIPHA
https://github.com/DIPHA/dipha http://www.rkwitt.org/blog/topological_machine_learning.html 一.预装软件 1 ...
swf格式文件如何修改里面的动作路径或者动作脚本（没有源文件的情况）
一.UrlActionEditor汉化版,这个工具是非常的简单和使用,直接把你需要需要修改的swf格式的flash文件在这里面打开二.如果需要更加详细的修改可以下载一个SWFDecompiler4. ...
(转)笔记320 SQLSERVER中的加密函数 2013-7-11
1 --SQLSERVER中的加密函数 2013-7-11 2 ENCRYPTBYASYMKEY() --非对称密钥 3 ENCRYPTBYCERT() --证书加密 4 ENCRYPTBYKEY() ...
用python+selenium抓取微博24小时热门话题的前15个并保存到txt中
抓取微博24小时热门话题的前15个,抓取的内容请保存至txt文件中,需要抓取排行.话题和阅读数 #coding=utf-8 from selenium import webdriver import ...
cocos多点触控实效注意事项
一定要设置AppController.mm的 [eaglView setMultipleTouchEnabled:YES];

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记的更多相关文章

随机推荐

热门专题