TensorFlow自编码器（AutoEncoder）之MNIST实践

自编码器可以用于降维，添加噪音学习也可以获得去噪的效果。

以下使用单隐层训练mnist数据集，并且共享了对称的权重参数。

模型本身不难，调试的过程中有几个需要注意的地方：

模型对权重参数初始值敏感，所以这里对权重参数w做了一些限制
需要对数据标准化
学习率设置合理（Adam，0.001）

1，建立模型

import numpy as np

import tensorflow as tf

class AutoEncoder(object):

    '''

    使用对称结构，解码器重用编码器的权重参数

    '''

    def __init__(self, input_shape, h1_size, lr):

        tf.reset_default_graph()# 重置默认计算图，有时出错后内存还一团糟

        with tf.variable_scope('auto_encoder', reuse=tf.AUTO_REUSE):

            self.W1 = self.weights(shape=(input_shape, h1_size), name='h1')

            self.b1 = self.bias(h1_size)

            self.W2 = tf.transpose(tf.get_variable('h1'))  # 共享参数，使用其转置

            self.b2 = self.bias(input_shape)

        self.lr = lr

        self.input = tf.placeholder(shape=(None, input_shape),

                                    dtype=tf.float32)

        self.h1_out = tf.nn.softplus(tf.matmul(self.input, self.W1) + self.b1)# softplus，类relu

        self.out = tf.matmul(self.h1_out, self.W2) + self.b2

        self.optimizer = tf.train.AdamOptimizer(learning_rate=self.lr)

        self.loss = 0.1 * tf.reduce_sum(

            tf.pow(tf.subtract(self.input, self.out), 2))

        self.train_op = self.optimizer.minimize(self.loss)

        self.sess = tf.Session()

        self.sess.run(tf.global_variables_initializer())

    def fit(self, X, epoches=100, batch_size=128, epoches_to_display=10):

        batchs_per_epoch = X.shape[0] // batch_size

        for i in range(epoches):

            epoch_loss = []

            for j in range(batchs_per_epoch):

                X_train = X[j * batch_size:(j + 1) * batch_size]

                loss, _ = self.sess.run([self.loss, self.train_op],

                                        feed_dict={self.input: X_train})

                epoch_loss.append(loss)

            if i % epoches_to_display == 0:

                print('avg_loss at epoch %d :%f' % (i, np.mean(epoch_loss)))

#         return self.sess.run(W1)

#     权重初始化参考别人的，这个居然很重要！用自己设定的截断正态分布随机没有效果

    def weights(self, shape, name, constant=1):

        fan_in = shape[0]

        fan_out = shape[1]

        low = -constant * np.sqrt(6.0 / (fan_in + fan_out))

        high = constant * np.sqrt(6.0 / (fan_in + fan_out))

        init = tf.random_uniform_initializer(minval=low, maxval=high)

        return tf.get_variable(name=name,

                               shape=shape,

                               initializer=init,

                               dtype=tf.float32)

    def bias(self, size):

        return tf.Variable(tf.constant(0, dtype=tf.float32, shape=[size]))

    def encode(self, X):

        return self.sess.run(self.h1_out, feed_dict={self.input: X})

    def decode(self, h):

        return self.sess.run(self.out, feed_dict={self.h1_out: h})

    def reconstruct(self, X):

        return self.sess.run(self.out, feed_dict={self.input: X})

2，加载数据及预处理

from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

import random

X_train = X_train.reshape(-1, 784)

# 测试集里随机10个图片用做测试

test_idxs = random.sample(range(X_test.shape[0]), 10)

data_test = X_test[test_idxs].reshape(-1, 784)

# 标准化

import sklearn.preprocessing as prep

processer = prep.StandardScaler().fit(X_train) # 这里还是用全部数据好，这个也很关键！

X_train = processer.transform(X_train)

X_test = processer.transform(data_test)

# 随机5000张图片用做训练

idxs = random.sample(range(X_train.shape[0]), 5000)

data_train = X_train[idxs]

3，训练

model = AutoEncoder(784, 200, 0.001)  # 学习率对loss影响也有点大

model.fit(data_train, batch_size=128, epoches=200)  # 200轮即可

4，测试，可视化对比图

decoded_test = model.reconstruct(X_test)

import matplotlib.pyplot as plt

%matplotlib inline

shape = (28, 28)

fig, axes = plt.subplots(2,10,

                         figsize=(10, 2),

                         subplot_kw={

                             'xticks': [],

                             'yticks': []

                         },

                         gridspec_kw=dict(hspace=0.1, wspace=0.1))

for i in range(10):

    axes[0][i].imshow(np.reshape(X_test[i], shape))

    axes[1][i].imshow(np.reshape(decoded_test[i], shape))

plt.show()

结果如下：

以上，可以在输入中添加点高斯噪音，增加鲁棒性。

TensorFlow自编码器（AutoEncoder）之MNIST实践的更多相关文章

用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识循环神经网络RNN相比传统的神经网络在处理序列化数据时更有优势,因为RNN能够将加入上(下)文信息进行考虑.一个简单的RNN如 ...
吴裕雄 PYTHON 神经网络——TENSORFLOW 双隐藏层自编码器设计处理MNIST手写数字数据集并使用TENSORBORD描绘神经网络数据2
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data os.envi ...
吴裕雄 PYTHON 神经网络——TENSORFLOW 单隐藏层自编码器设计处理MNIST手写数字数据集并使用TensorBord描绘神经网络数据
import os import numpy as np import tensorflow as tf import matplotlib.pyplot as plt from tensorflow ...
学习笔记TF061:分布式TensorFlow，分布式原理、最佳实践
分布式TensorFlow由高性能gRPC库底层技术支持.Martin Abadi.Ashish Agarwal.Paul Barham论文<TensorFlow:Large-Scale Mac ...
深度学习之自编码器AutoEncoder
原文地址:https://blog.csdn.net/marsjhao/article/details/73480859 一.什么是自编码器(Autoencoder) 自动编码器是一种数据的压缩算法, ...
Tesorflow-自动编码器(AutoEncoder)
直接附上代码: import numpy as np import sklearn.preprocessing as prep import tensorflow as tf from tensorf ...
tensorflow学习笔记五：mnist实例--卷积神经网络(CNN）
mnist的卷积神经网络例子和上一篇博文中的神经网络例子大部分是相同的.但是CNN层数要多一些,网络模型需要自己来构建. 程序比较复杂,我就分成几个部分来叙述. 首先,下载并加载数据: import ...
tensorflow学习笔记四：mnist实例--用简单的神经网络来训练和测试
刚开始学习tf时,我们从简单的地方开始.卷积神经网络(CNN)是由简单的神经网络(NN)发展而来的,因此,我们的第一个例子,就从神经网络开始. 神经网络没有卷积功能,只有简单的三层:输入层,隐藏层和输 ...
Tensorflow学习笔记（对MNIST经典例程的）的代码注释与理解
1 #coding:utf-8 # 日期 2017年9月4日环境 Python 3.5 TensorFlow 1.3 win10开发环境. import tensorflow as tf from ...

随机推荐

PHP类知识----值传递和引用传递
JS中数组是引用传递 PHP除了资源和对象等数据类型,其数据类型是值传递(即使数组也如此) 栈内存(快速内存)中存放标量数据类型,复合数据类型的变量名和数据地址在内存中,我们可以认为内存中有很多格子 ...
PHP类知识----析构方法点滴
网页执行完毕手动调用析构方法通过unset() 应用场景:断开mysql的连接不同情况下,析构方法调用的时机不同,程序执行顺序如下 <?php class mycoach { public ...
git回退错误的提交
提交代码导致冲突,执行merge后,冲掉其他人的提交.需要reset,并新建分支进行恢复解决方法: 1.找到最后一次提交到master分支的版本号,即[merge前的版本号] 2.会退到某个版本号 ...
IO—转换流和键盘录入
简单来说,由于方法的局限性和功能的需要,特此产生了转换流. InputStreamReader是字节流转换字符流的桥梁,为了提高效率,可以在缓冲区中放入转化流的对象,,并且构造函数第二个参数可以传入一 ...
【Python之路】特别篇--Python面向对象（初级篇）
概述面向过程:根据业务逻辑从上到下写垒代码函数式:将某功能代码封装到函数中,日后便无需重复编写,仅调用函数即可面向对象:对函数进行分类和封装,让开发“更快更好更强...” 面向过程编程最易被初学 ...
给PS添加ICO格式文件
为什么你的ps不能直接打开favicon.ico文件呢?因为你没有安装识别ico的格式插件. 安装步骤如下: 下载格式文件:https://pan.baidu.com/s/1lE0El1VtDqD5l ...
Android_(消息提示)多种使用Toast的消息提示
Toast是一种提供给用户简介信息的视图,可以创建和显示消息,该视图以浮于应用程序之上的形式呈现给用户.因为它并不获得焦点,即使用户正在输入什么也不会受到影响. Toast目标是尽可能以不显眼的方式, ...
「CF1105E」Helping Hiasat
题目链接戳我 \(Solution\) 将好友访问你的主页的状态用二进制存下来其中若第\(i\)位是\(1\),则表示这个好友在第\(i\)个\(1\)操作后访问了你的主页,否则没访问. 所以如果 ...
vmware安装centos虚拟机，没有ip地址
如果centos没有ip地址,就不能通过xshell等工具进行连接,且在上面部署的项目,外部也不能正常访问两种方式可以解决第一种,在安装的时候,在INSTALLATION SUMMARY界面的SY ...
mysql删除数据库所有表
-- 生成删除xxx数据库的所有表的sql语句SELECT CONCAT('drop table ',table_name,';') FROM information_schema.`TABLES` ...

TensorFlow自编码器（AutoEncoder）之MNIST实践

1，建立模型

2，加载数据及预处理

3，训练

4，测试，可视化对比图

TensorFlow自编码器（AutoEncoder）之MNIST实践的更多相关文章

随机推荐

热门专题