生成模型:

通过观测学习样本和标签的联合概率分布P(X,Y)进行训练,训练好的模型能够生成符合样本分布的新数据,在无监督学习方面,生成式模型能够捕获数据的高阶相关性,通过学习真实数据的本质特征,刻画样本数据的分布特征,生成与训练样本相似的新数据

生成式模型的分类:1. Autoencoder 2.自回归模型 3.生成对抗网络(gan,,generative adversarial networks)

Generative Adversarial Nworks: 1. generative model--->G     2.discriminative model------>D

Generative model: 生成模型捕捉样本数据的分布。

Discriminative model :是一个二分类器,用于判别输入数据是否真实。

总结:模型的优化过程属于二元极小极大博弈问题,模型训练时固定一方,更新另一方的参数,交替迭代,使得对方的错误最大化。最终,G 能估测出样本数据的分布。

Generitive Adversarial Networks Advantage :

1.可以渐进的逼近任意概率分布,可以认为是一种非参数的产生式建模方法,如果鉴别器训练良好,那么生成器可以玩美的学习到训练样本的分布。 GAN是渐进一致的!generative adversarial model

.GAN 是整幅图像进行衡量、评价和生成,生成采样的运行时间更短,一次产生一个样本,GAN考虑了整体信息且速度相对较快。

3.GAN理论上可以训练任何生成网络,可以训练生成靠近真实数据的地方产生样本点的模型,没有必要遵循任何种类的因子分解去设计模型。

4.劣势: 训练过程的稳定性和收敛性难以保证。

目前Generative Adversarial Networks 的分类:

1.CGAN:Conditional generative adversarial networks.

2.DCGAN: deep convolution generative adversarial networks.

3.VAEGAN:自动编码生成对抗网络

GAN的起源:

来源于博弈论的纳什均衡,包含generative model(G) 和 discriminative model (D) 。

目的: D辅助G产生与真实数据分布一致的伪数据。


GAN用于二次场降噪:

1.模型的输入为随机高斯白噪声信号z。 --------->二次场实测信号

2.噪声信号经由生成器经由G模型 映射到某个新的数据空间,得到生成数据G(z)。

3.由D 模型 根据真实数据x(二次场反演的理论信号)与生成数据G(z)的输入来分别输出一个概率值,表示D判断输入是真实数据还是生成虚假数据的置信度,以此判断G的产生数据的性能的好坏。

4.当D不能区别真实数据x和生成数据G(z)时,认为生成器G达到最优。


D的目标是区分两者: D(x)尽可能大,而同时使D(G(z))尽量小,两者差异尽可能大。

G的目标: 使产生的数据在D上的表现D(G(z))尽量与真实数据在D上的表现D(x)一致,让D不能区分生成数据与真实数据。

D和G相互竞争相互对抗,G和D的性能在迭代过程中不断提高,直到最后D(G(z))和真实数据的表现D(x)一致后不再优化。

加入求期望的操作,使G产生的数据既与真实数据有一定相似,同时又不完全同于真实数据,提高了模型的泛化能力。


注意: GAN不需要预设数据分布,理论上可以完全逼近真实数据,这也是GAN最大的优势。

特别注意,对于较大的图片,较多像素的情形,简单GAN的方式不太可控,经常出现训练崩塌的情形。


GAN中,每次学习参数的更新过程,为了防止这种情形,设为D更新K回,G才更新1回。

CGAN: 给GAN添加约束条件:草稿图生成图片

DCGAN:将有监督的学习模型CNN和无监督学习的GAN结合在一起。

infoGAN:输出改为G(z,c),有隐含意义的一组隐变量c和不能分解的有意义的noise z。

对抗网路的目的是在高维非凹的参数空间中,找到纳什均衡。但在GAN中使用梯度下降只会找到低的损失,不能找到真正的纳什均衡。


对工程实践的四点建议:

1. discriminative model 最后一层去掉 sigmod 

2.生成器与判别器的loss不取log

3.每次更新判别器D之后,把D中参数的绝对值截断到一个固定常数

4.用ADAM


GAN的应用

1.图片合成。

2.深度GAN模型,进行图片修补能根据确实区域的周边区域进行语义层面的修补,如 DCGAN+ADAM完成图像修补。

3.超分辨率:图像增强。  方法将16*16低分辨率图片作为约束条件,生成最合理解释的64*64的真实图片。

如此较好的超分辨率结果仅在小类别、规则分割的图片中适用。

超分辨率最通用的方法(super resolution generative adversarial networks,SRGAN)不依赖小类细化类别的数据集,能对各种类型的图片进行降噪和增强。SRGAN的特色是:

1.将图像空间的损失,替换为一个生成图像整体方差的约束项,以保证图像的平滑性

2.将真实数据与生成数据分别输入VGG-19网络根据得到的特征图的差异来定义损失项并对该差异加上规则化的处理。

3.结合三个损失:对抗损失,图像平滑项,特征图差异,送入GAN网络,生成超分辨率图片。


草稿图复原、图片上色、视频预测、文字生成图片(CGAN,以文本描述为条件来产生图像)(方法:文本进行编码后的特征与随机噪声信息串接输入产生器产生图像-->而编码后的文本特征也同时作为监督信号输入判别器以构建目标函数)


计算智能---》 认知智能-------》感知智能

tensorflow学习5----GAN模型初探的更多相关文章

  1. TensorFlow学习笔记12-word2vec模型

    为什么学习word2word2vec模型? 该模型用来学习文字的向量表示.图像和音频可以直接处理原始像素点和音频中功率谱密度的强度值, 把它们直接编码成向量数据集.但在"自然语言处理&quo ...

  2. tensorflow学习笔记——使用TensorFlow操作MNIST数据(1)

    续集请点击我:tensorflow学习笔记——使用TensorFlow操作MNIST数据(2) 本节开始学习使用tensorflow教程,当然从最简单的MNIST开始.这怎么说呢,就好比编程入门有He ...

  3. TensorFlow学习笔记:保存和读取模型

    TensorFlow 更新频率实在太快,从 1.0 版本正式发布后,很多 API 接口就发生了改变.今天用 TF 训练了一个 CNN 模型,结果在保存模型的时候居然遇到各种问题.Google 搜出来的 ...

  4. GAN模型生成手写字

    概述:在前期的文章中,我们用TensorFlow完成了对手写数字的识别,得到了94.09%的识别准确度,效果还算不错.在这篇文章中,笔者将带领大家用GAN模型,生成我们想要的手写数字. GAN简介 对 ...

  5. tensorflow学习笔记——自编码器及多层感知器

    1,自编码器简介 传统机器学习任务很大程度上依赖于好的特征工程,比如对数值型,日期时间型,种类型等特征的提取.特征工程往往是非常耗时耗力的,在图像,语音和视频中提取到有效的特征就更难了,工程师必须在这 ...

  6. GAN实战笔记——第三章第一个GAN模型:生成手写数字

    第一个GAN模型-生成手写数字 一.GAN的基础:对抗训练 形式上,生成器和判别器由可微函数表示如神经网络,他们都有自己的代价函数.这两个网络是利用判别器的损失记性反向传播训练.判别器努力使真实样本输 ...

  7. 用tensorflow学习贝叶斯个性化排序(BPR)

    在贝叶斯个性化排序(BPR)算法小结中,我们对贝叶斯个性化排序(Bayesian Personalized Ranking, 以下简称BPR)的原理做了讨论,本文我们将从实践的角度来使用BPR做一个简 ...

  8. Tensorflow学习笔记2019.01.22

    tensorflow学习笔记2 edit by Strangewx 2019.01.04 4.1 机器学习基础 4.1.1 一般结构: 初始化模型参数:通常随机赋值,简单模型赋值0 训练数据:一般打乱 ...

  9. Tensorflow学习笔记2019.01.03

    tensorflow学习笔记: 3.2 Tensorflow中定义数据流图 张量知识矩阵的一个超集. 超集:如果一个集合S2中的每一个元素都在集合S1中,且集合S1中可能包含S2中没有的元素,则集合S ...

随机推荐

  1. 第二章 构建布局良好的windows程序

    工具箱→菜单和工具栏 菜单栏 MenuStrip的类型 MenuItem:菜单项 TextBox:文本框 ComboBoX:组合框 Separato:分割线 前面都有ToolStrip做前缀 Appl ...

  2. Elasticsearch的架构原理剖析

    Elasticsearch 是最近两年异军突起的一个兼有搜索引擎和NoSQL数据库功能的开源系统,基于Java/Lucene构建.Elasticsearch 看名字就能大概了解下它是一个弹性的搜索引擎 ...

  3. MySQL中varchar最大长度是多少?

    一. varchar存储规则: 4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字时,只能存6个(每个汉字3字节) 5.0版本以上,varchar(20),指的是20字符,无 ...

  4. python安装提示错误Could not find a version that satisfies the requirement dateutil

    今天ytkah在安装python3组件时提示如下错误,这个是缺少依赖的问题,就试着用pip3 install dateutil,但还是提示同样的错误,怎么处理呢? Could not find a v ...

  5. [OpenCV]代码整理

    开发环境:Windows7, VS2010, OpenCV2.4.10 1.图像特征匹配 // AxFeatureExtract.cpp : 定义控制台应用程序的入口点. // #include &q ...

  6. PHP做APP接口时,如何保证接口的安全性??????????

    PHP做APP接口时,如何保证接口的安全性? 1.当用户登录APP时,使用https协议调用后台相关接口,服务器端根据用户名和密码时生成一个access_key,并将access_key保存在sess ...

  7. 前端文档汇总(含代码规范、开发流程、知识分享,持续更新) front-end-Doc

    https://juejin.im/post/5b1205b1f265da6e1a602a62 https://juejin.im/post/5b1205b1f265da6e1a602a62 http ...

  8. [py]python __file__ 与argv[0]

    http://andylin02.iteye.com/blog/933237 BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__ ...

  9. Sqlserver2008R2配置数据库镜像之我的经验总结

    一. 相关环境介结. 数据库:Sqlserver2008R2    网络环境:主机.镜像机(阿里云,青岛节点同域),见证机(本公司自己托管在上海) 二. 服务器相关配置. 1. 分别开启三台服务器50 ...

  10. python SMTP other

    HTML 正文,带链接和图片 //test.py import smtplib from email.mime.image import MIMEImage from email.mime.text ...