ACGAN 论文笔记
目的:合成(synthesis)高分辨率图像
方法:提出一种新的变种条件标签GAN
贡献:提出ACGAN,提出新的生成图片质量(可判别性和多样性 discriminability and diversity of samples)评估方法Inception Accuracy和MS-SSIM,得出结论:高分辨图片在ACGAN下可以更为准确地做classification(Across 1000 ImageNet classes, 128 _ 128 samples are more than twice as discriminable as
artificially resized 32 _ 32 samples. In addition, 84.7% of the
classes have samples exhibiting diversity comparable to real ImageNet data.1)。
核心:In this work we demonstrate that that adding more structure to the GAN latent space
along with a specialized cost function results in higher quality samples.
模型架构:

Loss函数:
The objective function has two parts: the log-likelihood of the correct
source, LS, and the
log-likelihood of the correct class, LC.

D is trained to maximize LS + LC while G is trained to maximize LC -LS.
Inception accuracy:
OpenAI提出Inception Score用以评价合成图像的真假,本文作者认为在生成图像不符合人的视觉感知时,Inception Score依然可能会很高,所以评判不准确。于是,作者将合成的图像输入训练好的Inception V3模型,对比模型的分类准确率。

不同分辨率的生成图片的Inception accuracy对比,人工降低分辨率后,accuracy也随之降低,说明生成的高分辨率图片不仅含有像素信息,还有一些帮助提高accuracy的信息。
总结:ACGan立足添加标签约束,以提高(高分辨率)图片生成质量,并提出新的生成图片质量和模式坍塌衡量标准。作者在附录中阐明了标签数量对模型稳定性的影响,实验中训练了100个AC-GAN,每个对10个标签进行分类。本文没有过多与其他现有的生成模型进行比较测试。
ACGAN 论文笔记的更多相关文章
- Face Aging with Conditional Generative Adversarial Network 论文笔记
Face Aging with Conditional Generative Adversarial Network 论文笔记 2017.02.28 Motivation: 本文是要根据最新的条件产 ...
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- 论文笔记之:Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
- Deep Learning论文笔记之(八)Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
- Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
- Deep Learning论文笔记之(六)Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
- Multimodal —— 看图说话(Image Caption)任务的论文笔记(一)评价指标和NIC模型
看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.这项任务要求模型可以识别图 ...
- 论文笔记(1):Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
- 论文笔记(2):A fast learning algorithm for deep belief nets.
论文笔记(2):A fast learning algorithm for deep belief nets. 这几天继续学习一篇论文,Hinton的A Fast Learning Algorithm ...
随机推荐
- idea web项目启动失败的情况---webapp文件夹路径不对,应如图位置
- [CodePlus2017]汀博尔
Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 158 Solved: 61[Submit][Status][Discuss] Description ...
- 背包DP 整理
题目 有N件物品和一个容量为V的背包.第i件物品的费用是c[i],价值是w[i].求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大. 基本思路 这是最基础的背包问题,特点是: ...
- BZOJ2196: [Usaco2011 Mar]Brownie Slicing
n<=500 * m<=500的方阵,先沿横坐标切A-1刀,再把每一块切B-1刀,得到A*B块,求这A*B块的数字之和的最小值的最大值. 最小值最大--二分,然后贪心切.每次扫一行,看这一 ...
- BCD工具类(8421)
目录 1.BCD介绍 (1)BCD码(Binary-Coded Decimal)亦称二进码十进数.用4位二进制数来表示1位十进制数中的0~9这10个数码.用二进制编码的十进制代码. (2)BCD码可分 ...
- lombok注解
官方文档:@EqualsAndHashCode 转:https://blog.csdn.net/zhanlanmg/article/details/50392266 1. 此注解会生成equals(O ...
- vs npm设置淘宝npm
VS2017自带的npm会去国外的镜像下载文件, 奇慢无比, 还是马云家淘宝的镜像适合国内用户. 淘宝npm镜像地址: https://registry.npm.taobao.org VS中使用淘宝 ...
- eclipse bug之'<>'operator is not allowed for source level below 1.7
eclipse中导入工程,报这个错'<>'operator is not allowed for source level below 1.7,把jdk改成1.7后,提示Android r ...
- pycharm查看代码注释的方法,代码编写日志及作者信息等
竟然在边栏有个右键的快捷键.annotate可以查看代码书写日期及作者 鼠标悬停可以看到更加详细的时间等信息 原理应该是利用git blame
- curl 发送post请求
curl 发送post请求 curl -X POST "http://localhost:8080/usr3?id=1&name=3&departmentId=2" ...