Tensorflow学习教程------tfrecords数据格式生成与读取

首先是生成tfrecords格式的数据，具体代码如下：

#coding:utf-8

import os

import tensorflow as tf

from PIL import Image

cwd = os.getcwd() 

'''

此处我加载的数据目录如下：

bt -- 14018.jpg

      14019.jpg

      14020.jpg

nbt -- 1_ddd.jpg

       1_dsdfs.jpg

       1_dfd.jpg

这里的bt nbt 就是类别，也就是代码中的classes

'''

writer = tf.python_io.TFRecordWriter("train.tfrecords")

classes = ['bt','nbt']

for index, name in enumerate(classes):

    class_path = cwd + '/'+ name +'/' #每一类图片的目录地址

    for img_name in os.listdir(class_path):

        img_path = class_path + img_name #每一张图片的路径

        img = Image.open(img_path)

        img = img.resize((224,224))

        img_raw = img.tobytes()   #将图片转化为原生bytes

        example = tf.train.Example(features = tf.train.Features(feature={

            'label':tf.train.Feature(int64_list = tf.train.Int64List(value=[index])),

            'img_raw':tf.train.Feature(bytes_list = tf.train.BytesList(value=[img_raw]))

     }))

        print "write" + ' ' + str(img_path) + "to train.tfrecords."

        writer.write(example.SerializeToString()) #序列化为字符串

writer.close()

然后读取生成的tfrecords数据，并且将tfrecords里面的数据保存成jpg格式的图片。具体代码如下：

#coding:utf-8

import os

import tensorflow as tf

from PIL import Image

cwd = '/media/project/tfLearnning/dataread/pic/'

def read_and_decode(filename):

    #根据文件名生成一个队列

    filename_queue = tf.train.string_input_producer([filename])

    reader = tf.TFRecordReader()

    _, serialized_example = reader.read(filename_queue) #返回文件名和文件

    features = tf.parse_single_example(serialized_example,

                                       features={

                                       'label':tf.FixedLenFeature([],tf.int64),

                                       'img_raw':tf.FixedLenFeature([],tf.string),

                                       })

    img = tf.decode_raw(features['img_raw'],tf.uint8)

    img = tf.reshape(img,[224,224,3])

    #img = tf.cast(img,tf.float32) * (1./255) - 0.5 # 将图片变成tensor

                                                   #对图片进行归一化操作将【0，255】之间的像素归一化到【-0.5，0.5】，标准化处理可以使得不同的特征具有相同的尺度（Scale）。

                                                   #这样，在使用梯度下降法学习参数的时候，不同特征对参数的影响程度就一样了

    label = tf.cast(features['label'], tf.int32) #将标签转化tensor

    print img

    print label

    return img, label

#read_and_decode('train.tfrecords')

img, label = read_and_decode('train.tfrecords')

#print img.shape, label

img_batch, label_batch = tf.train.shuffle_batch([img,label],batch_size=10,capacity=2000,min_after_dequeue=1000) #形成一个batch的数据，由于使用shuffle，因此每次取batch的时候

                                                                                                                #都是随机取的，可以使样本尽可能被充分地训练，保证min_after值小于capacit值

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    # 创建一个协调器，管理线程

    coord = tf.train.Coordinator()

    # 启动QueueRunner, 此时文件名队列已经进队

    threads = tf.train.start_queue_runners(sess=sess, coord=coord)

    for i in range(10):

        example, l = sess.run([img, label]) #从对列中一张一张读取图片和标签

        #example, l = sess.run([img_batch,label_batch])

        print(example.shape,l)

        img1=Image.fromarray(example, 'RGB') #将tensor转化成图片格式

        img1.save(cwd+str(i)+'_'+'Label_'+str(l)+'.jpg')#save image

    # 通知其他线程关闭

    coord.request_stop()

    # 其他所有线程关闭之后，这一函数才能返回

    coord.join(threads)

Tensorflow学习教程------tfrecords数据格式生成与读取的更多相关文章

Tensorflow学习教程------读取数据、建立网络、训练模型，小巧而完整的代码示例
紧接上篇Tensorflow学习教程------tfrecords数据格式生成与读取,本篇将数据读取.建立网络以及模型训练整理成一个小样例,完整代码如下. #coding:utf-8 import t ...
Tensorflow学习教程------过拟合
Tensorflow学习教程------过拟合回归:过拟合情况 / 分类过拟合防止过拟合的方法有三种: 1 增加数据集 2 添加正则项 3 Dropout,意思就是训练的时候隐层神经元每次随机 ...
Tensorflow学习教程------代价函数
Tensorflow学习教程------代价函数二次代价函数(quadratic cost): 其中,C表示代价函数,x表示样本,y表示实际值,a表示输出值,n表示样本的总数.为简单起见,使用一 ...
tensorflow 学习教程
tensorflow 学习手册 tensorflow 学习手册1:https://cloud.tencent.com/developer/section/1475687 tensorflow 学习手册 ...
Tensorflow学习笔记----模型的保存和读取（4）
一.模型的保存:tf.train.Saver类中的save TensorFlow提供了一个一个API来保存和还原一个模型,即tf.train.Saver类.以下代码为保存TensorFlow计算图的方 ...
Tensorflow学习教程------lenet多标签分类
本文在上篇的基础上利用lenet进行多标签分类.五个分类标准,每个标准分两类.实际来说,本文所介绍的多标签分类属于多任务学习中的联合训练,具体代码如下. #coding:utf-8 import te ...
Tensorflow学习教程------创建图启动图
Tensorflow作为目前最热门的机器学习框架之一,受到了工业界和学界的热门追捧.以下几章教程将记录本人学习tensorflow的一些过程. 在tensorflow这个框架里,可以讲是若数据类型,也 ...
Tensorflow学习教程------非线性回归
自己搭建神经网络求解非线性回归系数代码 #coding:utf-8 import tensorflow as tf import numpy as np import matplotlib.pypl ...
Tensorflow学习教程------利用卷积神经网络对mnist数据集进行分类_利用训练好的模型进行分类
#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tut ...

随机推荐

junit基础学习之-简介（1）
JUnit介绍 JUnit是一个开源的Java单元测试框架,由 Erich Gamma 和 Kent Beck 开发完成. 1 JUnit简介 JUnit主要用来帮助开发人员进行Java的单元测试, ...
hdu 2578 Dating with girls(1) 满足条件x+y=k的x,y有几组
Dating with girls(1) Time Limit: 6000/2000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Oth ...
inkscape批量将svg转为pdf
for i in *.svg;do inkscape --export-pdf=${i%.*}.pdf $i;done
Spring入门之二-------SpringIoC之实例化Bean以及注入Bean
一.实例化Bean 1. 通过默认构造方法实创建Bean public class Bean1 { public Bean1() { System.out.println(this.getClass( ...
sql同时删除多个表的数据
DELETE语句中指定多个表,根据多个表中的特定条件,从一个表或多个表中删除行. 不过,您不能在一个多表DELETE语句中使用ORDER BY或LIMIT. DELETE t1, t2 FROM t1 ...
四、Antd组件扩展
注意:先安装扩展,在安装antd框架,否则会提示一.安装扩展 1.组件 dva 查看项目依赖原因是我全局安装,依赖为空, npm i dva 查看依赖 cli装global 当访问报错: Warn ...
vue实现CheckBox与数组对象绑定
实现需求: 实现一个简易的购物车,页面的表格展示data数据中的一个数组对象,并提供选中商品和全选商品checkbox复选框,页面实时显示选中商品的总金额: 分析: 1:使用v-for循环渲染arra ...
Window NodeJs安装
1.下载NodeJs 官网下载地址:http://nodejs.cn/download/ 2.安装双击,全程next安装. 安装完成,在cmd下面执行查看版本命令,命令如下 C:\Users\A ...
win10编译jpeglib
jpeglib看名字都大概知道和图像格式jpg或jpeg有关了,是一个常用的图像处理软件都会依赖的开源库. 首先去官网下载jpeglib的源码,直接取这里下载:http://www.ijg.org/f ...
修改maven默认仓库（即repository）的路径
原文链接:https://blog.csdn.net/ideality_hunter/article/details/53006188 简要说明:主要操作为新建仓库路径,在maven的conf目录下修 ...

Tensorflow学习教程------tfrecords数据格式生成与读取

Tensorflow学习教程------tfrecords数据格式生成与读取的更多相关文章

随机推荐

热门专题