pytorch实现autoencoder

关于autoencoder的内容简介可以参考这一篇博客，可以说写的是十分详细了https://sherlockliao.github.io/2017/06/24/vae/

盗图一张，自动编码器讲述的是对于一副输入的图像，或者是其他的信号，经过一系列操作，比如卷积，或者linear变换，变换得到一个向量，这个向量就叫做对这个图像的编码，这个过程就叫做encoder，对于一个特定的编码，经过一系列反卷积或者是线性变换，得到一副图像，这个过程叫做decoder，即解码。

然而自动编码器有什么用，看到上面的博客所写

所以现在自动编码器主要应用有两个方面，第一是数据去噪，第二是进行可视化降维。然而自动编码器还有着一个功能就是生成数据。

然而现在还没有用过这方面的应用，在这里需要着重说明一点的是autoencoder并不是聚类，因为虽然对于每一副图像都没有对应的label，但是autoencoder的任务并不是对图像进行分类啊。

就事论事，下面来分析一下一个大神写的关于autoencoder的代码，这里先给出github链接

先奉上代码

 # -*-coding: utf-8-*-

 __author__ = 'SherlockLiao'

 import torch

 import torchvision

 from torch import nn

 from torch.autograd import Variable

 from torch.utils.data import DataLoader

 from torchvision import transforms

 from torchvision.utils import save_image

 from torchvision.datasets import MNIST

 import os

 if not os.path.exists('./dc_img'):

     os.mkdir('./dc_img')

 def to_img(x):  # 将vector转换成矩阵

     x = 0.5 * (x + 1)

     x = x.clamp(0, 1)

     x = x.view(x.size(0), 1, 28, 28)

     return x

 num_epochs = 100

 batch_size = 128

 learning_rate = 1e-3

 img_transform = transforms.Compose([

     transforms.ToTensor(),

     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))

 ])

 dataset = MNIST('./data', transform=img_transform)

 dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

 class autoencoder(nn.Module):

     def __init__(self):

         super(autoencoder, self).__init__()

         self.encoder = nn.Sequential(

             nn.Conv2d(1, 16, 3, stride=3, padding=1),  # b, 16, 10, 10

             nn.ReLU(True),

             nn.MaxPool2d(2, stride=2),  # b, 16, 5, 5

             nn.Conv2d(16, 8, 3, stride=2, padding=1),  # b, 8, 3, 3

             nn.ReLU(True),

             nn.MaxPool2d(2, stride=1)  # b, 8, 2, 2

         )

         self.decoder = nn.Sequential(

             nn.ConvTranspose2d(8, 16, 3, stride=2),  # b, 16, 5, 5

             nn.ReLU(True),

             nn.ConvTranspose2d(16, 8, 5, stride=3, padding=1),  # b, 8, 15, 15

             nn.ReLU(True),

             nn.ConvTranspose2d(8, 1, 2, stride=2, padding=1),  # b, 1, 28, 28

             nn.Tanh()  # 将输出值映射到-1~1之间

         )

     def forward(self, x):

         x = self.encoder(x)

         x = self.decoder(x)

         return x

 model = autoencoder().cuda()

 criterion = nn.MSELoss()

 optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate,

                              weight_decay=1e-5)

 for epoch in range(num_epochs):

     for data in dataloader:

         img, _ = data  # img是一个b*channel*width*height的矩阵

         img = Variable(img).cuda()

         # ===================forward=====================

         output = model(img)

         a = img.data.cpu().numpy()

         b = output.data.cpu().numpy()

         loss = criterion(output, img)

         # ===================backward====================

         optimizer.zero_grad()

         loss.backward()

         optimizer.step()

     # ===================log========================

     print('epoch [{}/{}], loss:{:.4f}'

           .format(epoch+1, num_epochs, loss.data[0]))

     if epoch % 10 == 0:

         pic = to_img(output.cpu().data)  # 将decoder的输出保存成图像

         save_image(pic, './dc_img/image_{}.png'.format(epoch))

 torch.save(model.state_dict(), './conv_autoencoder.pth')

可以说是写的相当清晰了，卷积，pooling，卷积，pooling，最后encoder输出的是一个向量，这个向量的尺寸是8*2*2，一共是32个元素，然后对这个8*2*2的元素进行反卷积操作，pytorch关于反卷积的操作的尺寸计算可以看这里

大概就这样开始训练，save_image是util中的一个函数，给定某一个batchsize的图像，将这个图像保存成8列，特定行的操作。

训练的loss如下

输出的图像如下，从左到右，从上往下，依次为epoch递增的情况

其实还是可以发现，随着epoch的增加，经过decoder生成的图像越来越接近真实图片

pytorch实现autoencoder的更多相关文章

Pytorch中的自编码(autoencoder)
Pytorch中的自编码(autoencoder) 本文资料来源:https://www.bilibili.com/video/av15997678/?p=25 什么是自编码先压缩原数据.提取出最有 ...
Variational Auto-encoder(VAE)变分自编码器-Pytorch
import os import torch import torch.nn as nn import torch.nn.functional as F import torchvision from ...
PyTorch官方中文文档：torch.nn
torch.nn Parameters class torch.nn.Parameter() 艾伯特(http://www.aibbt.com/)国内第一家人工智能门户,微信公众号:aibbtcom ...
pytorch做seq2seq注意力模型的翻译
以下是对pytorch 1.0版本的seq2seq+注意力模型做法语--英语翻译的理解(这个代码在pytorch0.4上也可以正常跑): # -*- coding: utf-8 -*- " ...
Pytorch入门之VAE
关于自编码器的原理见另一篇博客 : 编码器AE & VAE 这里谈谈对于变分自编码器(Variational auto-encoder)即VAE的实现. 1. 稀疏编码首先介绍一下“稀疏编码 ...
（转）Awesome PyTorch List
Awesome-Pytorch-list 2018-08-10 09:25:16 This blog is copied from: https://github.com/Epsilon-Lee/Aw ...
(转) The Incredible PyTorch
转自:https://github.com/ritchieng/the-incredible-pytorch The Incredible PyTorch What is this? This is ...
库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）
项目地址:https://github.com/bharathgs/Awesome-pytorch-list 列表结构: NLP 与语音处理计算机视觉概率/生成库其他库教程与示例论文实现 P ...
VAE--就是AutoEncoder的编码输出服从正态分布
花式解释AutoEncoder与VAE 什么是自动编码器自动编码器(AutoEncoder)最开始作为一种数据的压缩方法,其特点有: 1)跟数据相关程度很高,这意味着自动编码器只能压缩与训练数据相似 ...

随机推荐

PyQt+Html+Js
先做记录,后面有时间在仔细研究 https://www.cnblogs.com/jiangjh5/p/7209315.html?utm_source=itdadao&utm_medium=re ...
npm node sass 安装报错
报错为不能找到python2.7,记得曾经已经安装过python,结果npm install cnpm install npm install node-sass 各种不行,结果在cmd 输入pyt ...
ubuntu默认启动方式修改 psensor命令
Check UUID sudo blkid Then sudo gedit /etc/default/grub & to pull up the boot loader configurati ...
Ubuntu安装openssh-server并通过xshell连接
#安装ssh sudo apt-get install openssh-server openssh-client sudo apt-get update sudo apt-get upgrade 查 ...
Java Web(四) 过滤器Filter
Filter概述 Filter意为滤镜或者过滤器,用于在Servlet之外对request或者response进行修改.Filter提出了过滤链的概念.一个FilterChain包括多个Filter. ...
nyoj 0269 VF(dp)
nyoj 0269 VF 意思大致为从1-10^9数中找到位数和为s的个数分析:利用动态规划思想,一位一位的考虑,和s的范围为1-81 状态定义:dp[i][j] = 当前所有i位数的和为j的个数 ...
shell 多重条件判断
多重条件判断 '判断1 -a 判断2' 逻辑与,判断1和判断2都成立,最终的结果才为真 '判断1 -o 判断2' 逻辑或,判断1和判断2有一个成立,最终的结果就为真 '!判断' 逻辑非,使原始的判断式 ...
BIOS、BootLoader、uboot对比
BIOS BIOS是英文"Basic Input Output System"的缩略语,直译过来后中文名称就是"基本输入输出系统".其实,它是一组固化到计算机内 ...
django+xadmin+djcelery实现后台管理定时任务
继上一篇中间表的数据是动态的,图表展示的数据才比较准确.这里用到一个新的模块Djcelery,安装配置步骤如下: 1.安装 redis==2.10.6 celery==3.1.23 django-ce ...
Player Settings 导出设置
Player Settings is where you define various parameters (platform specific) for the final game that y ...

pytorch实现autoencoder

pytorch实现autoencoder的更多相关文章

随机推荐

热门专题