GAN模型生成手写字

概述：在前期的文章中，我们用TensorFlow完成了对手写数字的识别，得到了94.09%的识别准确度，效果还算不错。在这篇文章中，笔者将带领大家用GAN模型，生成我们想要的手写数字。

GAN简介

对抗性生成网络(GenerativeAdversarial Network)，由 Ian Goodfellow 首先提出，由两个网络组成，分别是generator网络（用于生成）和discriminator网络（用于判别）。GAN网络的目的就是使其自己生成一副图片，比如说经过对一系列猫的图片的学习，generator网络可以自己“绘制”出一张猫的图片，且尽量真实。discriminator网络则是用来进行判断的，将一张真实的图片和一张由generator网络生成的照片同时交给discriminator网络，不断训练discriminator网络，使其可以准确将discriminator网络生成的“假图片”找出来。就这样，generator网络不断改进使其可以骗过discriminator网络，而discriminator网络不断改进使其可以更准确找到“假图片”，这种相互促进相互对抗的关系，就叫做对抗网络。图一中展示了GAN模型的结构。

思路梳理

将MNIST数据集中标签为0的图片提取出来，然后训练discriminator网络，进行手写数字0识别，接着让generator产生一张随机图片，让训练好的discriminator去识别这张生成的图片，不断训练discriminator，直到discriminator网络将生成的图片当做数字0为止。

生成“假图片”

生成一张随机像素的28*28的图片，分别进行全连接，Leaky ReLU函数激活，dropout处理（随机丢弃一些神经元，防止过拟合），全连接，tanh函数激活，最终生成一张“假图片”，TensorFlow代码如下：

1def get_generator(noise_img, n_units, out_dim, reuse=False, alpha=0.01):
2    with tf.variable_scope("generator", reuse=reuse):
3        hidden1 = tf.layers.dense(noise_img, n_units)  # 全连接层
4        hidden1 = tf.maximum(alpha * hidden1, hidden1)
5        hidden1 = tf.layers.dropout(hidden1, rate=0.2)
6        logits = tf.layers.dense(hidden1, out_dim)
7        outputs = tf.tanh(logits)
8        return logits, outputs

图像判别

将需要进行判别的图片先后经过全连接，Leaky ReLU函数激活，全连接，sigmoid函数激活处理，最终输出图片的识别结果，TensorFlow代码如下：

1def get_discriminator(img, n_units, reuse=False, alpha=0.01):
2    with tf.variable_scope("discriminator", reuse=reuse):
3        hidden1 = tf.layers.dense(img, n_units)
4        hidden1 = tf.maximum(alpha * hidden1, hidden1)
5        logits = tf.layers.dense(hidden1, 1)
6        outputs = tf.sigmoid(logits)
7        return logits, outputs

完整代码

GAN手写数字识别的完整代码如下：

  1import tensorflow as tf
  2from tensorflow.examples.tutorials.mnist import input_data
  3import matplotlib.pyplot as plt
  4import numpy as np
  5
  6mnist = input_data.read_data_sets("E:/Tensor/MNIST_data/")
  7img = mnist.train.images[50]
  8
  9
 10def get_inputs(real_size, noise_size):
 11    real_img = tf.placeholder(tf.float32, [None, real_size], name="real_img")
 12    noise_img = tf.placeholder(tf.float32, [None, noise_size], name="noise_img")
 13    return real_img, noise_img
 14
 15
 16# 生成图像
 17def get_generator(noise_img, n_units, out_dim, reuse=False, alpha=0.01):
 18    with tf.variable_scope("generator", reuse=reuse):
 19        hidden1 = tf.layers.dense(noise_img, n_units)  # 全连接层
 20        hidden1 = tf.maximum(alpha * hidden1, hidden1)
 21        hidden1 = tf.layers.dropout(hidden1, rate=0.2)
 22        logits = tf.layers.dense(hidden1, out_dim)
 23        outputs = tf.tanh(logits)
 24        return logits, outputs
 25
 26
 27# 图像判别
 28def get_discriminator(img, n_units, reuse=False, alpha=0.01):
 29    with tf.variable_scope("discriminator", reuse=reuse):
 30        hidden1 = tf.layers.dense(img, n_units)
 31        hidden1 = tf.maximum(alpha * hidden1, hidden1)
 32        logits = tf.layers.dense(hidden1, 1)
 33        outputs = tf.sigmoid(logits)
 34        return logits, outputs
 35#真实图像size
 36img_size = mnist.train.images[0].shape[0]
 37#传入generator的噪声size
 38noise_size = 100
 39#生成器隐层参数
 40g_units = 128
 41#判别器隐层参数
 42d_units = 128
 43#Leaky ReLU参数
 44alpha = 0.01
 45#学习率
 46learning_rate = 0.001
 47#label smoothing
 48smooth = 0.1
 49tf.reset_default_graph()
 50real_img, noise_img = get_inputs(img_size, noise_size)
 51g_logits, g_outputs = get_generator(noise_img, g_units, img_size)
 52
 53d_logits_real, d_outputs_real = get_discriminator(real_img, d_units)
 54d_logits_fake, d_outputs_fake = get_discriminator(g_outputs, d_units, reuse=True)
 55
 56d_loss_real = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
 57    logits=d_logits_real, labels=tf.ones_like(d_logits_real)
 58) * (1 - smooth))
 59d_loss_fake = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
 60    logits=d_logits_fake, labels=tf.zeros_like(d_logits_fake)
 61))
 62d_loss = tf.add(d_loss_real, d_loss_fake)
 63g_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
 64    logits=d_logits_fake, labels=tf.ones_like(d_logits_fake)
 65) * (1 - smooth))
 66
 67train_vars = tf.trainable_variables()
 68g_vars = [var for var in train_vars if var.name.startswith("generator")]
 69d_vars = [var for var in train_vars if var.name.startswith("discriminator")]
 70
 71d_train_opt = tf.train.AdamOptimizer(learning_rate).minimize(d_loss, var_list=d_vars)
 72g_train_opt = tf.train.AdamOptimizer(learning_rate).minimize(g_loss, var_list=g_vars)
 73
 74
 75epochs = 10000
 76samples = []
 77n_sample = 10
 78losses = []
 79
 80i = j = 0
 81while i<10000:
 82    if mnist.train.labels[j] == 0:
 83        samples.append(mnist.train.images[j])
 84        i += 1
 85    j += 1
 86
 87print(len(samples))
 88size = samples[0].size
 89
 90with tf.Session() as sess:
 91    tf.global_variables_initializer().run()
 92    for e in range(epochs):
 93        batch_images = samples[e] * 2 -1
 94        batch_noise = np.random.uniform(-1, 1, size=noise_size)
 95
 96        _ = sess.run(d_train_opt, feed_dict={real_img:[batch_images], noise_img:[batch_noise]})
 97        _ = sess.run(g_train_opt, feed_dict={noise_img:[batch_noise]})
 98
 99    sample_noise = np.random.uniform(-1, 1, size=noise_size)
100    g_logit, g_output = sess.run(get_generator(noise_img, g_units, img_size,
101                                         reuse=True), feed_dict={
102        noise_img:[sample_noise]
103    })
104    print(g_logit.size)
105    g_output = (g_output+1)/2
106    plt.imshow(g_output.reshape([28, 28]), cmap='Greys_r')
107    plt.show()

训练效果

在经过了10000次的迭代后，generator网络生成的图片已经接近手写数字零的形状。

本文是对GAN模型的初次探索，在后续GAN模型的系列文章中，笔者将层层深入的去讲解GAN模型复杂的应用。

GAN模型生成手写字的更多相关文章

使用生成对抗网络（GAN）生成手写字
先放结果这是通过GAN迭代训练30W次,耗时3小时生成的手写字图片效果,大部分的还是能看出来是数字的. 实现原理简单说下原理,生成对抗网络需要训练两个任务,一个叫生成器,一个叫判别器,如字面意思, ...
GAN实战笔记——第三章第一个GAN模型：生成手写数字
第一个GAN模型-生成手写数字一.GAN的基础:对抗训练形式上,生成器和判别器由可微函数表示如神经网络,他们都有自己的代价函数.这两个网络是利用判别器的损失记性反向传播训练.判别器努力使真实样本输 ...
用TensorFlow教你手写字识别
博主原文链接:用TensorFlow教你做手写字识别(准确率94.09%) 如需转载,请备注出处及链接,谢谢. 2012 年,Alex Krizhevsky, Geoff Hinton, and Il ...
[Deep-Learning-with-Python]GAN图片生成
GAN 由Goodfellow等人于2014年引入的生成对抗网络(GAN)是用于学习图像潜在空间的VAE的替代方案.它们通过强制生成的图像在统计上几乎与真实图像几乎无法区分,从而能够生成相当逼真的合成 ...
tensorflow卷积神经网络与手写字识别
1.知识点 """ 基础知识: 1.神经网络(neural networks)的基本组成包括输入层.隐藏层.输出层.而卷积神经网络的特点在于隐藏层分为卷积层和池化层(po ...
【机器学习PAI实战】—— 玩转人工智能之利用GAN自动生成二次元头像
前言深度学习作为人工智能的重要手段,迎来了爆发,在NLP.CV.物联网.无人机等多个领域都发挥了非常重要的作用.最近几年,各种深度学习算法层出不穷, Generative Adverarial Ne ...
VS2010 根据模型生成数据库打开edmx.sql文件时 vs出现无响应的解决方案
今天在VS2010 sp1+sql server 2008 R2+Win7操作系统下测试ADO.NET 实体数据模型时 ,遇到这样一个问题. 首先建好实体模型,然后"根据模型生成数据库&qu ...
根据powerdesigner的OO模型生成C#代码
2007-05-15 08:34:11| 分类: 转贴部分 | 标签:学习帖子 |字号订阅习惯了用Powerdesigner设计数据库模型,XDE设计类图.因此我一般的设计方法是用PD做分析模 ...
MySQL Workbench将模型生成SQL文件出错
采用MySQL Workbench 设计好表和表关系后,从 File | Export 菜单中,选择 Forward Engineer SQL CREATE Script(正向引擎), 将我们的模型生 ...

随机推荐

php 将图片转成base64
/** * 获取图片的Base64编码(不支持url) * @date 2017-02-20 19:41:22 * * @param $img_file 传入本地图片地址 * * @return st ...
HBase shell scan 过滤器用法总结
比较器: 前面例子中的regexstring:2014-11-08.*.binary:\x00\x00\x00\x05,这都是比较器.HBase的filter有四种比较器: (1)二进制比较器:如’b ...
web项目部署到服务器中浏览器中显示乱码
项目部署之后浏览器打开查看时页面乱码这里可能需要修改一下tomcat配置文件,首先找到Tomcat的安装路径下的conf/server.xml文件,找到之后可以CTRL+F搜索如下的内容: < ...
动态规划-LIS1
https://vjudge.net/contest/297216?tdsourcetag=s_pctim_aiomsg#problem/J #include<bits/stdc++.h> ...
Live2D插件--漂浮的二次元小姐姐
这个插件找了很久,都没找到,今天偶然翻到一个小哥的博客发现了这个,果断偷走. 教程转自简书:https://www.jianshu.com/p/1cedcf183633 还有这些,你可能有用修改位置 ...
检测 web项目 404 500 状态的页面
用于发版前自动化测试用法 1.使用参数 -f 指定url配置文件2.url文件简单配置, 每行一条URL 下面三种格式都可以,如果不声明 GET.POST 默认为GET请求 https://www. ...
python制作词云
需要模块wordcloud,pip install wordcloud安装即可.代码: , #边距background_color='black',#指定背景颜色font_path='simhei.t ...
Mesos源码分析(12): Mesos-Slave接收到RunTask消息
在前文Mesos源码分析(8): Mesos-Slave的初始化中,Mesos-Slave接收到RunTaskMessage消息,会调用Slave::runTask. void Slave::ru ...
Openstack中RabbitMQ RPC代码分析
在Openstack中,RPC调用是通过RabbitMQ进行的. 任何一个RPC调用,都有Client/Server两部分,分别在rpcapi.py和manager.py中实现. 这里以nova-sc ...
[python] bluepy 一款python封装的BLE利器
1.bluepy 简介 bluepy 是github上一个很好的蓝牙开源项目,其地址在 LINK-1, 其主要功能是用python实现linux上BLE的接口. This is a project t ...

GAN模型生成手写字

GAN模型生成手写字的更多相关文章

随机推荐

热门专题