Dataset：利用Python将已有mnist数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍

from __future__ import print_function

import cPickle

import gzip

import os.path

import random

import numpy as np

print("Expanding the MNIST training set")

if os.path.exists("../data/mnist_expanded.pkl.gz"):

    print("The expanded training set already exists.  Exiting.")

else:

    f = gzip.open("../data/mnist.pkl.gz", 'rb')

    training_data, validation_data, test_data = cPickle.load(f)

    f.close()

    expanded_training_pairs = []

    j = 0

    for x, y in zip(training_data[0], training_data[1]):

        expanded_training_pairs.append((x, y))

        image = np.reshape(x, (-1, 28))

        j += 1

        if j % 1000 == 0: print("Expanding image number", j)

        for d, axis, index_position, index in [

                (1,  0, "first", 0),

                (-1, 0, "first", 27),

                (1,  1, "last",  0),

                (-1, 1, "last",  27)]:

            new_img = np.roll(image, d, axis)

            if index_position == "first":

                new_img[index, :] = np.zeros(28)

            else:

                new_img[:, index] = np.zeros(28)

            expanded_training_pairs.append((np.reshape(new_img, 784), y))

    random.shuffle(expanded_training_pairs)

    expanded_training_data = [list(d) for d in zip(*expanded_training_pairs)]

    print("Saving expanded data. This may take a few minutes.")

    f = gzip.open("../data/mnist_expanded.pkl.gz", "w")

    cPickle.dump((expanded_training_data, validation_data, test_data), f)

    f.close()

Dataset：利用Python将已有mnist数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍—Jason niu的更多相关文章

利用Python特殊变量__dict__快速实现__repr__的一种方法
在<第8.15节 Python重写自定义类的__repr__方法>.<Python中repr(变量)和str(变量)的返回值有什么区别和联系>.<第8.13节 Pytho ...
TF之AE：AE实现TF自带数据集数字真实值对比AE先encoder后decoder预测数字的精确对比—Jason niu
import tensorflow as tf import numpy as np import matplotlib.pyplot as plt #Import MNIST data from t ...
PSO：利用PSO实现对一元函数y = sin(10*pi*x) ./ x进行求解优化，找到最优个体适应度—Jason niu
x = 1:0.01:2; y = sin(10*pi*x) ./ x; figure plot(x, y) title('绘制目标函数曲线图—Jason niu'); hold on c1 = 1. ...
TF：利用TF的train.Saver将训练好的variables(W、b)保存到指定的index、meda文件—Jason niu
import tensorflow as tf import numpy as np W = tf.Variable([[2,1,8],[1,2,5]], dtype=tf.float32, name ...
利用Caffe训练模型(solver、deploy、train_val)+python使用已训练模型
本文部分内容来源于CDA深度学习实战课堂,由唐宇迪老师授课如果你企图用CPU来训练模型,那么你就疯了- 训练模型中,最耗时的因素是图像大小size,一般227*227用CPU来训练的话,训练1万次可 ...
《利用Python进行数据分析： Python for Data Analysis 》学习随笔
NoteBook of <Data Analysis with Python> 3.IPython基础 Tab自动补齐变量名变量方法路径解释 ?解释, ??显示函数源码 ?搜索命名 ...
《利用python进行数据分析》读书笔记--第八章绘图和可视化
http://www.cnblogs.com/batteryhp/p/5025772.html python有许多可视化工具,本书主要讲解matplotlib.matplotlib是用于创建出版质量图 ...
利用python进行数据分析之绘图和可视化
matplotlib API入门使用matplotlib的办法最常用的方式是pylab的ipython,pylab模式还会向ipython引入一大堆模块和函数提供一种更接近与matlab的界面,ma ...
Python 数据分析（二本实验将学习利用 Python 数据聚合与分组运算，时间序列，金融与经济数据应用等相关知识
Python 数据分析(二) 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识第1节 groupby 技术第2节数据聚合第3节分组级运算和转换第4 ...

随机推荐

用VS制作的windows服务安装包安装完后如何让服务自动启动
vs 服务做成安装包,如何安装以后启动服务,只要在类名为projectinstaller的类中重写commit事件即可 public override void Commit(IDic ...
通过设置ie的通过跨域访问数据源，来访问本地服务
1.首先设置通过域访问数据源设置通过域访问数据源 2.javascript脚本ajax使用本地服务登录(评价,人证的类似)接口 <html> <head> <scrip ...
Spark启动时的master参数以及Spark的部署方式
我们在初始化SparkConf时,或者提交Spark任务时,都会有master参数需要设置,如下: conf = SparkConf().setAppName(appName).setMaster(m ...
package.json包描述文件说明
//commonjs包规范-说明 { "name": "leyi",//包名,不允许空格 "description": "hell ...
1010:Tempter of the Bone
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1010 Problem Description The doggie found a bone in a ...
Question Of AI Model Training
1 模型训练基本步骤准备原始数据,定义神经网络结构及前向传播算法定义loss,选择反向传播优化算法生成Session,在训练数据进行迭代训练,使loss到达最小在测试集或者验证集上对准确率进行 ...
OAuth2 token
1.资源服务器 package com.ruhuanxingyun.config; import com.fasterxml.jackson.databind.ObjectMapper; import ...
从认识面向对象到构造函数的标准写法(构造函数的继承、多态、ECMA6中新代替语法class) - 下
笔记一个包含:认识面向对象.构造函数的封装.继承.多态.ECMA6中新代替语法class 下:包括构造函数的继承.多态.ECMA6中新代替语法class 构造函数的继承从父一级延续下来的属性和功能( ...
OpenCV-Python入门教程3-图像基本操作（访问像素点/ROI/通道分离）
一.获取和修改像素点的值 import cv2img = cv2.imread('lena.jpg') # 100, 90表示行列坐标 px = img[100, 90] print(px) # 获取 ...
h5在手机端实现简单复制
<a href="https://blog-static.cnblogs.com/files/ruanqin/clipboard.min.js">下载clipborrd ...

Dataset：利用Python将已有mnist数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍—Jason niu

Dataset：利用Python将已有mnist数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍—Jason niu的更多相关文章

随机推荐

热门专题