GAN——生成手写数字

《Generative Adversarial Nets》是 GAN 系列的鼻祖。在这里通过 PyTorch 实现 GAN ，并且用于手写数字生成。

摘要： 我们提出了一个新的框架，通过对抗处理来评估生成模型。其中，我们同时训练两个 model ：一个是生成模型 G，用于获取数据分布；另一个是判别模型 D，用来预测样本来自训练数据而不是生成模型 G 的概率。G 的训练过程是最大化 D 犯错的概率。这个框架对应于一个极小极大的二人游戏。在任意函数 G 和 D 的空间中，存在着一个唯一的解，G 恢复训练数据的分布而 D 一直等于1/2. 在 G 和 D 都由多层感知器定义的情况下，整个系统可以通过反向传播进行训练。　　

import time

import numpy as np

import torch

import torch.nn.functional as F

from torchvision import datasets

from torchvision import transforms

import torch.nn as nn

from torch.utils.data import DataLoader

if torch.cuda.is_available():

    torch.backends.cudnn.deterministic = True

要导入的包

#########################

## SETTINGS

#########################

# Device

device = torch.device("cuda:2" if torch.cuda.is_available() else "cpu")

# Hyperparameters

random_seed = 123

generator_learning_rate = 0.001

discriminator_learning_rate = 0.001

num_epochs = 100

batch_size = 128

LATENT_DIM = 100

IMG_SHAPE = (1, 28, 28)

IMG_SIZE = 1

for x in IMG_SHAPE:

    IMG_SIZE *= x

设置超参数

#########################

## MNIST DATASET

#########################

train_dataset = datasets.MNIST(root='../data',

                               train=True,

                               transform=transforms.ToTensor(),

                               download=True)

test_dataset = datasets.MNIST(root='../data',

                              train=False,

                              transform=transforms.ToTensor())

train_loader = DataLoader(dataset=train_dataset,

                          batch_size=batch_size,

                          shuffle=True)

test_loader = DataLoader(dataset=test_dataset,

                         batch_size=batch_size,

                         shuffle=False)

# Checking the dataset

for images, labels in train_loader:

    print('Image batch dimensions:', images.shape)

    print('Image label dimensions:', labels.shape)

    break

# 输出

# Image batch dimensions: torch.Size([128, 1, 28, 28])

# Image label dimensions: torch.Size([128])

加载MNIST数据集

##############################

## MODEL

##############################

class GAN(torch.nn.Module):

    def __init__(self):

        super(GAN, self).__init__()

        self.generator = nn.Sequential(

            nn.Linear(LATENT_DIM, 128),

            nn.LeakyReLU(inplace=True),

            nn.Dropout(p=0.5),

            nn.Linear(128, IMG_SIZE),

            nn.Tanh()

        )

        self.discriminator = nn.Sequential(

            nn.Linear(IMG_SIZE, 128),

            nn.LeakyReLU(inplace=True),

            nn.Dropout(p=0.5),

            nn.Linear(128, 1),

            nn.Sigmoid()

        )

    def generator_forward(self, z):

        img = self.generator(z)

        return img

    def discriminator_forward(self, img):

        pred = model.discriminator(img)

        return pred.view(-1)

GAN—Model

start_time = time.time()

discr_costs = []

gener_costs = []

for epoch in range(num_epochs):

    model = model.train()

    for batch_idx, (features, targets) in enumerate(train_loader):

        features = (features - 0.5) * 2.

        features = features.view(-1, IMG_SIZE).to(device)

        targets = targets.to(device)

        # Adversarial ground truths

        valid = torch.ones(targets.size(0)).float().to(device)

        fake = torch.zeros(targets.size(0)).float().to(device)

        ### FORWARD AND BACK PROP

        # ---------------------

        # Train Generator

        # ---------------------

        # make new images

        z = torch.zeros((targets.size(0), LATENT_DIM)).uniform_(-1.0, 1.0).to(device)

        # generate a batch of images

        generated_features = model.generator_forward(z)

        # Loss measures generators's ability to fool the discriminator

        discr_pred = model.discriminator_forward(generated_features)

        gener_loss = F.binary_cross_entropy(discr_pred, valid)

        optim_gener.zero_grad()

        gener_loss.backward()

        optim_gener.step()

        # ---------------------

        # Train Discriminator

        # ---------------------

        # Measure discriminator's ability to classify real from samples

        discr_pred_real = model.discriminator_forward(features.view(-1, IMG_SIZE))

        real_loss = F.binary_cross_entropy(discr_pred_real, valid)

        discr_pred_fake = model.discriminator_forward(generated_features.detach())

        fake_loss = F.binary_cross_entropy(discr_pred_fake, fake)

        discr_loss = 0.5 * (real_loss + fake_loss)

        optim_discr.zero_grad()

        discr_loss.backward()

        optim_discr.step()

        discr_costs.append(discr_loss)

        gener_costs.append(gener_loss)

        ### LOGGING

        if not batch_idx % 100:

            print('Epoch: %03d/%03d | Batch %03d/%03d | Gen/Dis Loss: %.4f/%.4f'

                 %(epoch+1, num_epochs, batch_idx, len(train_loader), gener_loss, discr_loss))

    print('Time elapsed: %.2f min' % ((time.time() - start_time)/60))

print('Total Training Time: %.2f min' % ((time.time() - start_time)/60))

网络训练

画出 generator loss 和 discriminator loss 的变化图：

plt.plot(range(len(gener_costs)), gener_costs, label='generator loss')

plt.plot(range(len(discr_costs)), discr_costs, label='discriminator loss')

plt.legend()

plt.savefig('./loss.jpg')

plt.show()

利用以上训练的 Generator 生成一些仿手写数字图片：

#########################

## VISUALIZATION

#########################

model.eval()

# Make new images

z = torch.zeros((5, LATENT_DIM)).uniform_(-1.0, 1.0).to(device)

generated_features = model.generator_forward(z)

imgs = generated_features.view(-1, 28, 28)

fig, axes = plt.subplots(nrows=1, ncols=5, figsize=(20, 2.5))

for i, ax in enumerate(axes):

    axes[i].imshow(imgs[i].detach().numpy(), cmap='binary')

再生成几次：

可以发现，以上生成的数字图片有些很清晰，但有些很模糊，不易辨认，但是结果已经让人很兴奋了~~

后续可以对GAN进行改进，从而生成质量更高的图片。

Reference

　　[1] deeplearning-models——Github

　　[2] Paper《Generative Adversarial Network》　

GAN——生成手写数字的更多相关文章

GAN实战笔记——第三章第一个GAN模型：生成手写数字
第一个GAN模型-生成手写数字一.GAN的基础:对抗训练形式上,生成器和判别器由可微函数表示如神经网络,他们都有自己的代价函数.这两个网络是利用判别器的损失记性反向传播训练.判别器努力使真实样本输 ...
卷积生成对抗网络（DCGAN）---生成手写数字
深度卷积生成对抗网络(DCGAN) ---- 生成 MNIST 手写图片 1.基本原理生成对抗网络(GAN)由2个重要的部分构成: 生成器(Generator):通过机器生成数据(大部分情况下是图像 ...
Tensorflow:DCGAN生成手写数字
参考地址:https://blog.csdn.net/miracle_ma/article/details/78305991 使用DCGAN(deep convolutional GAN):深度卷积G ...
使用神经网络来识别手写数字【译】（三）- 用Python代码实现
实现我们分类数字的网络好,让我们使用随机梯度下降和 MNIST训练数据来写一个程序来学习怎样识别手写数字. 我们用Python (2.7) 来实现.只有 74 行代码!我们需要的第一个东西是 MNI ...
C#中调用Matlab人工神经网络算法实现手写数字识别
手写数字识别实现设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率关键字:二值化投影矩阵目标定位 Matlab 手写数字图像识别简介: 手写 ...
基于opencv的手写数字识别（MFC,HOG,SVM）
参考了秋风细雨的文章:http://blog.csdn.net/candyforever/article/details/8564746 花了点时间编写出了程序,先看看效果吧. 识别效果大概都能正确. ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...
深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%
源码和运行结果 cuda:https://github.com/zhxfl/CUDA-CNN C语言版本参考自:http://eric-yuan.me/ 针对著名手写数字识别的库mnist,准确率是9 ...
利用神经网络算法的C＃手写数字识别
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 下载Demo - 2.77 MB (原始地址):handwritten_character_recognition.zip 下载源码 - 70. ...

随机推荐

windows zlib库编译步骤
下载地址 http://www.zlib.net/ 动态库下载地址如果自己实在不想编译的,可以直接下载 https://download.csdn.net/download/zhangxuechao ...
Struts2 Action的3种创建方式
Action是Strut2的核心内容,相当于Servlet,用于处理业务. Action是一个Java类,直接新建Java类即可. Action有3种实现方式. 1.使用POJO,设置成员变量,写对应 ...
linux 中断底半部机制对比（任务队列，工作队列，软中断）--由linux RS485引出的血案【转】
转自:http://blog.chinaunix.net/uid-20768928-id-5077401.html 在LINUX RS485的使用过程中,由于各种原因,最后不得不使用中断底半部机制的方 ...
17、DNS服务器
DNS domain name system 域名系统 [root@li ~]# vim /etc/nsswitch.conf hosts: files dns --涉及到 ...
爬虫---Beautiful Soup 反反爬虫事例
前两章简单的讲了Beautiful Soup的用法,在爬虫的过程中相信都遇到过一些反爬虫,如何跳过这些反爬虫呢?今天通过知乎网写一个简单的反爬中什么是反爬虫简单的说就是使用任何技术手段,阻止别人批 ...
Maven 中 dependencyManagement 元素，知识点
Maven 提供的 dependencyManagement 元素既能让子模块继承到父模块的依赖配置,又能保证子模块依赖使用的灵活性.在 dependencyManagement 元素下的依赖声明不会 ...
YAML文件格式简介
一.yaml简介 yaml是一种用来写配置文件的序列化语言,跟json有些像,yaml又称作json的超集,yaml的设计则是为了友好可读性,主要用于配置信息的书写,而json设计的目的则是为了简 ...
Linux上用NAT实现上网
1. 安装好Linux后,选择NAT方式 2. 在Windows主机上用ipconfig /all 查看VMnet8的IP地址,一般是192.168.X.1/255.255.255.0,如果不知道是哪 ...
JDOJ 3055: Nearest Common Ancestors
JDOJ 3055: Nearest Common Ancestors JDOJ传送门 Description 给定N个节点的一棵树,有K次查询,每次查询a和b的最近公共祖先. 样例中的16和7的公共 ...
[Taro] 解决使用 Taro UI 小程序下 Iconfont 图标不显示问题
Taro UI 配置第三方的文档配置即可解决 https://taro-ui.jd.com/#/docs/icon 解决问题: 之前只有在H5下才显示 Iconfont 图标后来按照此文 ...

GAN——生成手写数字

GAN——生成手写数字的更多相关文章

随机推荐

热门专题