TFlearn——（2）SVHN

1，数据集简介

　　SVHN（Street View House Number）Dateset 来源于谷歌街景门牌号码，原生的数据集1也就是官网的 Format 1 是一些原始的未经处理的彩色图片，如下图所示（不含有蓝色的边框），下载的数据集含有 PNG 的图像和 digitStruct.mat 的文件，其中包含了边框的位置信息，这个数据集每张图片上有好几个数字，适用于 OCR 相关方向。

　　这里采用 Format2, Format2 将这些数字裁剪成32x32的大小，如图所示，并且数据是 .mat 文件。

2，数据处理

　　数据集含有两个变量 X 代表图像，训练集 X 的 shape 是（32，32，3，73257）也就是(width, height, channels, samples), tensorflow 的张量需要（samples, width, height, channels），所以需要转换一下，由于直接调用 cifar 10 的网络模型，数据只需要先做个归一化，所有像素除于255就 OK，另外原始数据 0 的标签是 10，这里要转化成 0，并提供 one_hot 编码。

#!/usr/bin/env python2

# -*- coding: utf-8 -*-

"""

Created on Thu Jan 19 09:55:36 2017

@author: cheers

"""

import scipy.io as sio

import matplotlib.pyplot as plt

import numpy as np

image_size = 32

num_labels = 10

def display_data():

    print 'loading Matlab data...'

    train = sio.loadmat('train_32x32.mat')

    data=train['X']

    label=train['y']

    for i in range(10):

        plt.subplot(2,5,i+1)

        plt.title(label[i][0])

        plt.imshow(data[...,i])

        plt.axis('off')

    plt.show()

def load_data(one_hot = False):

    train = sio.loadmat('train_32x32.mat')

    test = sio.loadmat('test_32x32.mat')

    train_data=train['X']

    train_label=train['y']

    test_data=test['X']

    test_label=test['y']

    train_data = np.swapaxes(train_data, 0, 3)

    train_data = np.swapaxes(train_data, 2, 3)

    train_data = np.swapaxes(train_data, 1, 2)

    test_data = np.swapaxes(test_data, 0, 3)

    test_data = np.swapaxes(test_data, 2, 3)

    test_data = np.swapaxes(test_data, 1, 2)

    test_data = test_data / 255.

    train_data =train_data / 255.

    for i in range(train_label.shape[0]):

         if train_label[i][0] == 10:

             train_label[i][0] = 0

    for i in range(test_label.shape[0]):

         if test_label[i][0] == 10:

             test_label[i][0] = 0

    if one_hot:

        train_label = (np.arange(num_labels) == train_label[:,]).astype(np.float32)

        test_label = (np.arange(num_labels) == test_label[:,]).astype(np.float32)

    return train_data,train_label, test_data,test_label

if __name__ == '__main__':

    load_data(one_hot = True)

    display_data()

3，TFearn 训练

注意 ImagePreprocessing 对数据做了 0 均值化。网络结构也比较简单，直接调用 TFlearn 的 cifar10 例子。

from __future__ import division, print_function, absolute_import

import tflearn

from tflearn.data_utils import shuffle, to_categorical

from tflearn.layers.core import input_data, dropout, fully_connected

from tflearn.layers.conv import conv_2d, max_pool_2d

from tflearn.layers.estimator import regression

from tflearn.data_preprocessing import ImagePreprocessing

from tflearn.data_augmentation import ImageAugmentation

# Data loading and preprocessing

import svhn_data as SVHN

X, Y, X_test, Y_test = SVHN.load_data(one_hot = True)

X, Y = shuffle(X, Y)

# Real-time data preprocessing

img_prep = ImagePreprocessing()

img_prep.add_featurewise_zero_center()

img_prep.add_featurewise_stdnorm()

# Convolutional network building

network = input_data(shape=[None, 32, 32, 3],

                     data_preprocessing=img_prep)

network = conv_2d(network, 32, 3, activation='relu')

network = max_pool_2d(network, 2)

network = conv_2d(network, 64, 3, activation='relu')

network = conv_2d(network, 64, 3, activation='relu')

network = max_pool_2d(network, 2)

network = fully_connected(network, 512, activation='relu')

network = dropout(network, 0.5)

network = fully_connected(network, 10, activation='softmax')

network = regression(network, optimizer='adam',

                     loss='categorical_crossentropy',

                     learning_rate=0.001)

# Train using classifier

model = tflearn.DNN(network, tensorboard_verbose=0)

model.fit(X, Y, n_epoch=15, shuffle=True, validation_set=(X_test, Y_test),

          show_metric=True, batch_size=96, run_id='svhn_cnn')

训练结果：

Training Step: 11452  | total loss: 0.68217 | time: 7.973s

| Adam | epoch: 015 | loss: 0.68217 - acc: 0.9329 -- iter: 72576/73257

Training Step: 11453  | total loss: 0.62980 | time: 7.983s

| Adam | epoch: 015 | loss: 0.62980 - acc: 0.9354 -- iter: 72672/73257

Training Step: 11454  | total loss: 0.58649 | time: 7.994s

| Adam | epoch: 015 | loss: 0.58649 - acc: 0.9356 -- iter: 72768/73257

Training Step: 11455  | total loss: 0.53254 | time: 8.005s

| Adam | epoch: 015 | loss: 0.53254 - acc: 0.9421 -- iter: 72864/73257

Training Step: 11456  | total loss: 0.49179 | time: 8.016s

| Adam | epoch: 015 | loss: 0.49179 - acc: 0.9416 -- iter: 72960/73257

Training Step: 11457  | total loss: 0.45679 | time: 8.027s

| Adam | epoch: 015 | loss: 0.45679 - acc: 0.9433 -- iter: 73056/73257

Training Step: 11458  | total loss: 0.42026 | time: 8.038s

| Adam | epoch: 015 | loss: 0.42026 - acc: 0.9469 -- iter: 73152/73257

Training Step: 11459  | total loss: 0.38929 | time: 8.049s

| Adam | epoch: 015 | loss: 0.38929 - acc: 0.9491 -- iter: 73248/73257

Training Step: 11460  | total loss: 0.35542 | time: 9.928s

| Adam | epoch: 015 | loss: 0.35542 - acc: 0.9542 | val_loss: 0.40315 - val_acc: 0.9085 -- iter: 73257/73257

TFlearn——（2）SVHN的更多相关文章

TFlearn——（1）notMNIST
1, 数据集简介 notMNIST, 看名字就知道,跟MNIST脱不了干系,其实就是升级版的MNIST,含有 A-J 10个类别的艺术印刷体字符,字符的形状各异,噪声更多,难度比 MNIST 要 ...
（转）【重磅】无监督学习生成式对抗网络突破，OpenAI 5大项目落地
[重磅]无监督学习生成式对抗网络突破,OpenAI 5大项目落地 [新智元导读]"生成对抗网络是切片面包发明以来最令人激动的事情!"LeCun前不久在Quroa答问时毫不加掩饰对生 ...
数十种TensorFlow实现案例汇集：代码+笔记（转）
转:https://www.jiqizhixin.com/articles/30dc6dd9-39cd-406b-9f9e-041f5cbf1d14 这是使用 TensorFlow 实现流行的机器学习 ...
torchvision库简介（翻译）
部分跟新于:4.24日 torchvision 0.2.2.post3 torchvision是独立于pytorch的关于图像操作的一些方便工具库. torchvision的详细介绍在:http ...
神经网络中embedding层作用——本质就是word2vec，数据降维，同时可以很方便计算同义词（各个word之间的距离），底层实现是2-gram（词频）+神经网络
Embedding tflearn.layers.embedding_ops.embedding (incoming, input_dim, output_dim, validate_indices= ...
两种开源聊天机器人的性能测试（二）——基于tensorflow的chatbot
http://blog.csdn.net/hfutdog/article/details/78155676 开源项目链接:https://github.com/dennybritz/chatbot-r ...
深度学习方法（十）：卷积神经网络结构变化——Maxout Networks，Network In Network，Global Average Pooling
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 技术交流QQ群:433250724,欢迎对算法.技术感兴趣的同学加入. 最近接下来几篇博文会回到神经网络结构 ...
TensorFlow学习笔记（六）循环神经网络
一.循环神经网络简介循环神经网络的主要用途是处理和预测序列数据.循环神经网络刻画了一个序列当前的输出与之前信息的关系.从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面节点的输出. ...
深度学习之 TensorFlow（一）：基础库包的安装
1.TensorFlow 简介:TensorFlow 是谷歌公司开发的深度学习框架,也是目前深度学习的主流框架之一. 2.TensorFlow 环境的准备: 本人使用 macOS,Python 版本直 ...

随机推荐

HP LaserJet MFP M227_M231双面打印
双面打印设置
数据预处理之独热编码（One-Hot Encoding）（转载）
问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值. 例如,考虑一下的三个特征: ["male", "female"] ["from ...
c pointer
1. 定义数组后,数组名是一个常数, 而指针是一个变量如下: int a[10]; int *p; p=a; \\ 与 p=&a[0]等价则*p++表示 a[1] 而 a++ 则是错误的 ...
java.lang.NullPointerException - 如何处理空指针异常
当应用程序试图null在需要对象的情况下使用时抛出.这些包括: 调用null对象的实例方法. 访问或修改null对象的字段. 把长度null当作一个数组. 像访问或修改null阵列一样访问或修改插槽. ...
JDBC远程连接数据库
使用jdbc远程连接数据库(非本地数据库)出现的问题可用的解决方法: 1.修改mysql配置文件配置文件中注释掉 bind-address=127.0.0.1 2.修改数据库登入mysql后,更改 ...
for循环语句个人小结
重新看了一下光盘上的用for循环写一个菱形的答案,发现了其实有几点是可以灵活运用的: 1,当定义行数的时候,也可以用相等的间断的数字隔开,比如 for(int a = 5; a >= 1; a- ...
120. Triangle(Array; DP)
Given a triangle, find the minimum path sum from top to bottom. Each step you may move to adjacent n ...
Java SE-基本数据类型对应包装类
包装类 Java是面向对象的编程语言,包装类的出现更好的体现这一思想. 其次,包装类作为类是有属性有方法的,功能比基本数据类型要强大. [八种基本数据类型的包装类] byte ——Byte short ...
转载博客：rabbitmq
原文出处:http://www.cnblogs.com/sam-uncle/p/9202933.html 假设有这一些比较耗时的任务,按照上一次的那种方式,我们要一直等前面的耗时任务完成了之后才能接着 ...
catkin-tools
http://catkin-tools.readthedocs.io/en/latest/cheat_sheet.html 一.Initializing Workspaces初始化工作空间初始化具有 ...

TFlearn——（2）SVHN

TFlearn——（2）SVHN的更多相关文章

随机推荐

热门专题