（第二章第三部分）TensorFlow框架之读取二进制数据

系列博客链接：

（第二章第一部分）TensorFlow框架之文件读取流程：https://www.cnblogs.com/kongweisi/p/11050302.html

（第二章第二部分）TensorFlow框架之读取图片数据：https://www.cnblogs.com/kongweisi/p/11050539.html

本文概述：

目标
- 应用tf.FixedLengthRecordReader实现二进制文件读取
- 应用tf.decode_raw实现解码二进制数据
应用
- CIFAR10类图片数据读取

1、CIFAR10二进制数据集介绍

https://www.cs.toronto.edu/~kriz/cifar.html

二进制版本数据文件

二进制版本

二进制版本包含文件data_batch_1.bin，data_batch_2.bin，...，data_batch_5.bin以及test_batch.bin。

这些文件中的每一个格式如下，数据中每个样本包含了目标值和特征值：

<1×标签> <3072×像素>

...

<1×标签> <3072×像素>

第一个字节是第一个图像的标签，它是一个0-9范围内的数字。接下来的3072个字节是图像像素的值。前1024个字节是红色通道值，下1024个绿色，最后1024个蓝色。值以行优先顺序存储，因此前32个字节是图像第一行的红色通道值。每个文件都包含10000个这样的3073字节的“行”图像，但没有任何分隔行的限制。因此每个文件应该完全是30730000字节长。

2、CIFAR10 二进制数据读取

2.1 分析

构造文件队列
读取二进制数据并进行解码
处理图片数据形状以及数据类型，批处理返回
开启会话线程运行

2.2 代码

定义CIFAR类

class CifarRead(object):

    """

    二进制文件的读取，tfrecords存储读取

    """

    def __init__(self):

        # 定义一些图片的属性

        self.height = 32

        self.width = 32

        self.channel = 3

        self.label_bytes = 1

        self.image_bytes = self.height * self.width * self.channel

        self.bytes = self.label_bytes + self.image_bytes

实现读取数据方法read_and_decode(self, file_list)

def read_and_decode(self, file_list):

        """

        读取二进制原始数据，解码成数据张量

        :return:

        """

        # 1、找构造文件队列

        file_queue = tf.train.string_input_producer(file_list)

        # 2、使用二进制读取器读取内容

        # 一共读取 1+3072=3073个字节

        reader = tf.FixedLengthRecordReader(self.bytes)

        # 此时的value是某个文件的某个样本

        key, value = reader.read(file_queue)

        # 3、二进制数据解码 decode_raw

        label_image = tf.decode_raw(value, tf.uint8)

        print(label_image)

        # 把图片的特征值和目标值单独拿出来处理

        # tf.slice切片  label是：[0] 到 [1]  image是：[1] 到 [3072]

        label = tf.slice(label_image, [0], [self.label_bytes])

        image = tf.slice(label_image, [self.label_bytes], [self.image_bytes])

        # 标签、图片的类型转换、形状转换

        label_cast = tf.cast(label, tf.int32)

        # 设置图片的特征值形状

        # 使用reshape去修改形状

        # 图片特征值的数据，如果用于去训练计算，可以转换成float32类型

        image_reshape = tf.reshape(image, [self.height, self.width, self.channel])

        print(label_cast, image_reshape)

        # 4、批处理图片数据

        image_batch, label_batch = tf.train.batch([image_reshape, label_cast], batch_size=10, num_threads=1, capacity=10)

        return image_batch, label_batch

会话逻辑

if __name__ == "__main__":

    # 生成路径+文件名的列表

    filename = os.listdir(FLAGS.cifar_datadir)

    # 路径+名字拼接

    file_list = [os.path.join(FLAGS.cifar_datadir, file) for file in filename if file[-3:] == "bin"]
    # file_list = [os.path.join("路径", file) for file in filename]

　　# 实例化类

    cr = CifarRead()

    # 从原始二进制文件读取

    image_batch, label_batch = cr.read_and_decode(file_list)


　　# 开启会话打印内容

    with tf.Session() as sess:

        # 创建线程协调器

        coord = tf.train.Coordinator()

        # 开启子线程去读取数据

        # 返回子线程实例

        threads = tf.train.start_queue_runners(sess=sess, coord=coord)

        # 获取样本数据去训练

        print(sess.run([image_batch, label_batch]))

        # 关闭子线程，回收

        coord.request_stop()

        coord.join(threads)

（第二章第三部分）TensorFlow框架之读取二进制数据的更多相关文章

（第二章第二部分）TensorFlow框架之读取图片数据
系列博客链接: (第二章第一部分)TensorFlow框架之文件读取流程:https://www.cnblogs.com/kongweisi/p/11050302.html 本文概述: 目标说明图片 ...
（第二章第一部分）TensorFlow框架之文件读取流程
本章概述:在第一章的系列文章中介绍了tf框架的基本用法,从本章开始,介绍与tf框架相关的数据读取和写入的方法,并会在最后,用基础的神经网络,实现经典的Mnist手写数字识别. 有四种获取数据到Tens ...
【Web探索之旅】第二部分第三课：框架和内容管理系统
内容简介 1.第二部分第三课:框架和内容管理系统 2.第二部分第四课预告:数据库第二部分第三课:框架和内容管理系统上一课我们介绍了服务器端的编程语言,有PHP,Java,Python,Ruby ...
CSS3秘笈复习：第一章&第二章&第三章
第一章: 1.<cite>标签不仅可以将网页设置为斜体,还能给标题做上标记,使它便于被搜索引擎搜索到. 第二章: 1.import指令链接样式表: CSS本身有一种添加外部样式的方法:@i ...
jQuery复习：第二章&第三章
第二章一.选择器 1.层次选择器 $(“ancestor descendant”)选取ancestor元素里的所有后代元素 $(“parent > child”)选取parent元素下的chi ...
使用MYSQL数据库实现编程----第二章第三章课堂知识小总结
第二章1:创建数据库create database myschool 2.数据类型 1.整型 int 2.小数 double 精确度要求高的 ----Decimal(18,4) 2222222 ...
（第一章第一部分）TensorFlow框架介绍
接下来会更新一系列博客,介绍TensorFlow的入门使用,尽可能详细. 本文概述: 说明TensorFlow的数据流图结构 1.数据流图介绍 TensorFlow是一个采用数据流图(data fl ...
《数据结构与算法Python语言描述》习题第二章第三题（python版）
ADT Rational: #定义有理数的抽象数据类型 Rational(self, int num, int den) #构造有理数num/den +(self, Rational r2) #求出本 ...
flask框架下读取mysql数据转换成json格式API
研究了一天因为需要从数据库拿数据然后转换成json的格式 expose出去为 API 发现一条数据是容易,两条以上我居然搞了这么久好歹出来了先贴一下后面更新 mysql的操作比较容易了htt ...

随机推荐

Java中的wait方法简单介绍。
一 wait方法怎么用? package com.aaa.threaddemo; /* * 多线程中的wait方法? public final void wait() throws Interrupt ...
django之定义统一返回数据格式与GET/POST装饰器
1. 为了返回给网页前端的格式统一,定义一个通用的插件类,返回统一格式数据 # enconding:utf-8 """ 定义一个插件类, ""&quo ...
JDBC 连接DRUID 连接池！
一.1.创建一个floder目录,[名称lib] 2. 导入mysql.jar包和 druid.jar 包.---------->bulid path 二.创建 sourcefolder 目录 ...
开发升讯威在线客服系统启示录：怎样编写堪比 MSDN 的用户手册
本系列文章详细介绍使用 .net core 和 WPF 开发升讯威在线客服与营销系统的过程. 免费在线使用 & 免费私有化部署:https://kf.shengxunwei.com 文章目 ...
一条SQL更新语句是如何执行的
文章首发于公众号「蝉沐风」,认真写好每一篇文章,欢迎大家关注交流这是图解MySQL的第2篇文章,这篇文章会通过一条SQL更新语句的执行流程让大家清楚地明白: 什么是InnoDB页?缓存页又是什么?为 ...
计算机电子书 2016 BiliDrive 备份
下载方式根据你的操作系统下载不同的 BiliDrive 二进制. 执行: bilidrive download <link> 链接文档链接 Go入门指南.epub (1.87 MB) ...
安装JDK，以及配置环境变量
卸载JDK 删除Java的安装目录删除JAVA_HOME 删除path下关于Java的目录 Java-version 安装JDK 使用浏览器搜索JDK,找到下载地址同意协议下载电脑对应的版本双 ...
SpringBoot集成druid数据库连接池的简单使用
简介 Druid是阿里巴巴旗下Java语言中最好的数据库连接池.Druid能够提供强大的监控和扩展功能. 官网: https://github.com/alibaba/druid/wiki/常见问题 ...
Spring学习六：自定义Event事件
Spring 中的自定义事件编写和发布自己的自定义事件有许多步骤.按照在这一章给出的说明来编写,发布和处理自定义 Spring 事件. 步骤描述 1 创建一个名称为 SpringExample 的 ...
Redis的配置文件redis.conf详解
Redis的配置文件位于redis的安装目录下,一般不要直接操作出厂设置的配置文件,需要对其进行备份.# Redis的配置文件样例: # Redis configuration file exampl ...