深度学习之 GAN 进行 mnist 图片的生成

mport numpy as np

import os

import codecs

import torch

from PIL import Image

import PIL

def get_int(b):

    return int(codecs.encode(b, 'hex'), 16)

def extract_image(path, extract_path):

    with open(path, 'rb') as f:

        data = f.read()

        assert get_int(data[:4]) == 2051

        length = get_int(data[4:8])

        num_rows = get_int(data[8:12])

        num_cols = get_int(data[12:16])

        images = []

        parsed = np.frombuffer(data, dtype=np.uint8, offset=16)

        parsed = parsed.reshape(length, num_rows, num_cols)

    for image_i, image in enumerate(parsed):

        Image.fromarray(image, 'L').save(os.path.join(extract_path, 'image_{}.jpg'.format(image_i)))

image_path = './mnist/t10k-images.idx3-ubyte'

extract_path = './mnist/data/image'

import math

def images_square_grid(images, mode):

    save_size = math.floor(np.sqrt(images.shape[0]))

    # Scale to 0-255

    images = (((images - images.min()) * 255) / (images.max() - images.min())).astype(np.uint8)

    # Put images in a square arrangement

    images_in_square = np.reshape(

            images[:save_size*save_size],

            (save_size, save_size, images.shape[1], images.shape[2], images.shape[3]))

    if mode == 'L':

        images_in_square = np.squeeze(images_in_square, 4)

    # Combine images to grid image

    new_im = Image.new(mode, (images.shape[1] * save_size, images.shape[2] * save_size))

    for col_i, col_images in enumerate(images_in_square):

        for image_i, image in enumerate(col_images):

            im = Image.fromarray(image, mode)

            new_im.paste(im, (col_i * images.shape[1], image_i * images.shape[2]))

    return new_im

def get_image(image_path, width, height, mode):

    image = Image.open(image_path)

    if image.size != (width, height):

        face_width = face_width = 108

        j = (image.size[0] - face_width) // 2

        i = (image.size[1] - face_height) // 2

        image = image.crop([j, i, j + face_width, i + face_height])

        image = image.resize([width, height], Image.BILINEAR)

    return np.array(image.convert(mode))

def get_batch(image_files, width, height, mode):

    data_batch = np.array([get_image(sample_file, width, height, mode) for sample_file in image_files]).astype(np.float32)

    if len(data_batch.shape) < 4:

        data_batch = data_batch.reshape(data_batch.shape + (1,))

    return data_batch

%matplotlib inline

import os

from glob import glob

from matplotlib import pyplot

data_dir = './mnist/data'

show_n_images = 25

mnist_images = get_batch(glob(os.path.join(data_dir, 'image/*.jpg'))[:show_n_images], 28, 28, 'L')

pyplot.imshow(images_square_grid(mnist_images, 'L'), cmap='gray')

from torch.utils import data

import torchvision as tv

batch_size = 50

transforms = tv.transforms.Compose([

    tv.transforms.Resize(96),

    PIL.ImageOps.grayscale,

    tv.transforms.ToTensor()

])

root="d:\\work\\yoho\\dl\\dl-study\\chapter8\\mnist\\data"

dataset = tv.datasets.ImageFolder(root, transform=transforms)

dataloader = data.DataLoader(dataset, batch_size, shuffle=True, num_workers=1, drop_last=True)

import torch.nn as nn

import torch.optim as optim

from torch.nn.modules import loss

from torch.autograd import Variable as V

class GNet(nn.Module):

    def __init__(self, opt):

        super(GNet, self).__init__()

        ngf = opt["ngf"]

        target = opt["target"] or 3

        self.main = nn.Sequential(

            nn.ConvTranspose2d( opt["nz"], ngf * 8, 4, 1, 0, bias=False),

            nn.BatchNorm2d(ngf * 8),

            nn.ReLU(True),

            nn.ConvTranspose2d( ngf * 8, ngf * 4, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ngf * 4),

            nn.ReLU(True),

            nn.ConvTranspose2d( ngf * 4, ngf * 2, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ngf * 2),

            nn.ReLU(True),

            nn.ConvTranspose2d( ngf * 2, ngf, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ngf),

            nn.ReLU(True),

            nn.ConvTranspose2d( ngf, target, 5, 3, 1, bias=False),

            nn.Tanh()

        )

    def forward(self, input):

        return self.main(input)

class DNet(nn.Module):

    def __init__(self, opt):

        super(DNet, self).__init__()

        ndf = opt["ndf"]

        input = opt["input"] or 3

        self.main = nn.Sequential(

            nn.Conv2d(input, ndf, 5, 3, 1, bias=False),

            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ndf * 2),

            nn.LeakyReLU(0.3, inplace=True),

            nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ndf * 4),

            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),

            nn.BatchNorm2d(ndf * 8),

            nn.LeakyReLU(0.2, inplace=True),

            nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=False),

            nn.Sigmoid()

        )

    def forward(self, input):

        return self.main(input).view(-1)

lr_g = 0.01

lr_d = 0.01

ngf = 64

ndf = 64

raw_f = 1

nz = 100

d_every = 1

g_every = 5

net_g = GNet({"target": raw_f, "ngf": ngf, 'nz': nz})

net_d = DNet({"input": raw_f, "ndf": ndf})

opt_g = optim.Adam(net_g.parameters(), lr_g, betas=(0.5, 0.999))

opt_d = optim.Adam(net_d.parameters(), lr_g, betas=(0.5, 0.999))

criterion = torch.nn.BCELoss()

true_labels = V(torch.ones(batch_size))

fake_labels = V(torch.zeros(batch_size))

fix_noises = V(torch.randn(batch_size, nz, 1, 1))

noises = V(torch.randn(batch_size, nz, 1, 1))

def train():

    for ii, (img, _) in enumerate(dataloader):

        real_img = V(img)

        if (ii + 1) % d_every == 0:

            opt_d.zero_grad()

            output = net_d(real_img)

            loss_d = criterion(output, true_labels)

            loss_d.backward()

            noises.data.copy_(torch.randn(batch_size, nz, 1, 1))

            fake_img = net_g(noises)

            fake_img = fake_img.detach()

            fake_output = net_d(fake_img)

            loss_fake_d = criterion(fake_output, fake_labels)

            loss_fake_d.backward()

            opt_d.step()

        if (ii + 1) % g_every == 0:

            opt_g.zero_grad()

            noises.data.copy_(torch.randn(batch_size, nz, 1, 1))

            fake_image = net_g(noises)

            fake_output = net_d(fake_img)

            loss_g = criterion(fake_output, true_labels)

            loss_g.backward()

            opt_g.step()

def print_image():

    fix_fake_imgs = net_g(fix_noises)

    fix_fake_imgs = fix_fake_imgs.data.view(batch_size, 96, 96, 1).numpy()

    pyplot.imshow(images_square_grid(fix_fake_imgs, 'L'), cmap='gray')

epochs = 20

def main():

    for i in range(epochs):

        print("epoch {}".format(i))

        train()

        if i % 2 == 0:

            print_image()

main()

注意 GAN 很慢，要使用 GPU来工作

深度学习之 GAN 进行 mnist 图片的生成的更多相关文章

4.keras实现-->生成式深度学习之用变分自编码器VAE生成图像(mnist数据集和名人头像数据集)
变分自编码器(VAE,variatinal autoencoder) VS 生成式对抗网络(GAN,generative adversarial network) 两者不仅适用于图像,还可以 ...
【深度学习】--GAN从入门到初始
一.前述 GAN,生成对抗网络,在2016年基本火爆深度学习,所有有必要学习一下.生成对抗网络直观的应用可以帮我们生成数据,图片. 二.具体 1.生活案例比如假设真钱 r 坏人定义为G 我们通过 ...
深度学习-Wasserstein GAN论文理解笔记
GAN存在问题训练困难,G和D多次尝试没有稳定性,Loss无法知道能否优化,生成样本单一,改进方案靠暴力尝试 WGAN GAN的Loss函数选择不合适,使模型容易面临梯度消失,梯度不稳定,优化目标不 ...
机器学习 —— 深度学习 —— 基于DAGNN的MNIST NET
DAGNN 是Directed acyclic graph neural network 缩写,也就有向图非循环神经网络.我使用的是由MatConvNet 提供的DAGNN API.选择这套API作为 ...
深度学习之GAN对抗神经网络
1.结构图 2.知识点生成器(G):将噪音数据生成一个想要的数据判别器(D):将生成器的结果进行判别, 3.代码及案例 # coding: utf-8 # ## 对抗生成网络案例 ## # # # ...
【Python开发】【神经网络与深度学习】网络爬虫之图片自动下载器
python爬虫实战--图片自动下载器之前介绍了那么多基本知识[Python爬虫]入门知识(没看的赶紧去看)大家也估计手痒了.想要实际做个小东西来看看,毕竟: talk is cheap show ...
为什么要用深度学习来做个性化推荐 CTR 预估
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:苏博览深度学习应该这一两年计算机圈子里最热的一个词了.基于深度学习,工程师们在图像,语音,NLP等领域都取得了令人振奋的进展.而深 ...
NLP+VS︱深度学习数据集标注工具、方法摘录，欢迎补充~~
~~因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具. . . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...
好书推荐计划：Keras之父作品《Python 深度学习》
大家好,我禅师的助理兼人工智能排版住手助手条子.可能非常多人都不知道我.由于我真的难得露面一次,天天给禅师做底层工作. wx_fmt=jpeg" alt="640? wx_fmt= ...

随机推荐

清除input[type=number]的默认样式
input[type=number] { -moz-appearance:textfield; } input[type=number]::-webkit-inner-spin-button, inp ...
JS合并两个数组的方法
JS合并两个数组的方法我们在项目过程中,有时候会遇到需要将两个数组合并成为一个的情况.比如: var a = [1,2,3]; var b = [4,5,6]; 有两个数组a.b,需求是将两个数组合 ...
BaaS 的由来（1）
百度百科是这么定义的, BaaS(后端即服务:Backend as a Service)公司为移动应用开发者提供整合云后端的边界服务.其实不仅是移动应用,现在更多的PC应用也同样适用移动端的标准. 在 ...
ASP.NET Core Web API下事件驱动型架构的实现（四）：CQRS架构中聚合与聚合根的实现
在前面两篇文章中,我详细介绍了基本事件系统的实现,包括事件派发和订阅.通过事件处理器执行上下文来解决对象生命周期问题,以及一个基于RabbitMQ的事件总线的实现.接下来对于事件驱动型架构的讨论,就需 ...
微信小程序-布局
flex-direction 传送门 border 传送门边框粗细:thin(细线).medium(中粗线)和thick(粗线) 类型:九个确定值:none(无边框线). dotted(由点组成的 ...
【python学习笔记】8.异常
[python学习笔记]8.异常 raise Exception: 抛出指定异常 try/except: 捕捉异常 except: 第一个参数是需要捕获的异常类型,可以是多个类型组成元组,第二个参数是 ...
如何配置VS使得可以通过域名或IP访问
一.前言: 在平时使用Visio Studio进行网站开发,经常会遇到一个问题.既要可以使用VS的Debug一步步跟进项目的走向,又必须是外界可以访问的.这个问题会在微信开发中非常常见,就拿微信开发中 ...
关于各种文件用Editplus的方式打开出现“向程序发送命令时出现问题”的解决方法
其实网上有很多解决方法,但是我试过都没有用. 我出现这个错误的原因是因为我的Editplus是以管理员的方式运行的,所以解决的办法有两种: 一.修改Editplus的兼容性,方法如下: 首先在Edit ...
python爬微信公众号前10篇历史文章（2）-拼接URL&发送http请求
如何拼接想要的url http://weixin.sogou.com/weixin?type=1&page=1&ie=utf8&query=%E5%A4%A7%E7%BA%BD ...
c++ --> const关键字总结
const关键字总结 C++中的const关键字的用法非常灵活,而使用const将大大改善程序的健壮性.const 是C++中常用的类型修饰符,常类型是指使用类型修饰符const说明的类型,常类型的变 ...

深度学习之 GAN 进行 mnist 图片的生成

深度学习之 GAN 进行 mnist 图片的生成

深度学习之 GAN 进行 mnist 图片的生成的更多相关文章

随机推荐

热门专题