回到上一篇文件的读取分这么几步:

# 构造队列

    # 1，构造图片文件的队列

    file_queue = tf.train.string_input_producer(filelist)

# 构造阅读器

    # 2，构造图片阅读器读取队列数据（按一张）

    reader = tf.WholeFileReader()

# 读取文件然后解码

# 3, 读取图片数据并进行解码

key,value = reader.read(file_queue)

image = tf.image.decode_jpeg(value)

# 文件处理

# 4，处理图片数据的大小

image_resize = tf.image.resize_images(image,[200,200])

image_resize.set_shape([200,200,3])

# 批量处理

# 5，批处理

image_batch = tf.train.batch([image_resize],batch_size=7,num_threads=1,capacity=3)

# 循环输出

    with tf.Session() as sess:

        coord = tf.train.Coordinator()

        threads = tf.train.start_queue_runners(sess,coord=coord)

        print(sess.run([image_batch]))

        coord.request_stop()

        coord.join(threads)

图像基本概念

在图像数字化表示当中，分为黑白和彩色两种。在数字化表示图片的时候，有三个因素。分别是图片的长、图片的宽、图片的颜色通道数。那么黑白图片的颜色通道数为1，它只需要一个数字就可以表示一个像素位；而彩色照片就不一样了，它有三个颜色通道，分别为RGB，通过三个数字表示一个像素位。TensorFlow支持JPG、PNG图像格式，RGB、RGBA颜色空间。图像用与图像尺寸相同(heightwidthchnanel)张量表示。图像所有像素存在磁盘文件，需要被加载到内存。

图像大小压缩

大尺寸图像输入占用大量系统内存。训练CNN需要大量时间，加载大文件增加更多训练时间，也难存放多数系统GPU显存。大尺寸图像大量无关本征属性信息，影响模型泛化能力。最好在预处理阶段完成图像操作，缩小、裁剪、缩放、灰度调整等。图像加载后，翻转、扭曲，使输入网络训练信息多样化，缓解过拟合。Python图像处理框架PIL、OpenCV。TensorFlow提供部分图像处理方法。

tf.image.resize_images 压缩图片导致定大小

图像数据读取实例

同样图像加载与二进制文件相同。图像需要解码。输入生成器(tf.train.string_input_producer)找到所需文件，加载到队列。tf.WholeFileReader 加载完整图像文件到内存，WholeFileReader.read 读取图像，tf.image.decode_jpeg 解码JPEG格式图像。图像是三阶张量。RGB值是一阶张量。加载图像格式为[batch_size,image_height,image_width,channels]。批数据图像过大过多，占用内存过高，系统会停止响应。直接加载TFRecord文件，可以节省训练时间。支持写入多个样本。

读取图片数据到Tensor

管道读端多文件内容处理

但是会发现read只返回一个图片的值。所以我们在之前处理文件的整个流程中，后面的内容队列的出队列需要用特定函数去获取。

tf.train.batch 读取指定大小（个数）的张量
tf.train.shuffle_batch 乱序读取指定大小（个数）的张量

import tensorflow as tf

import os

import warnings

warnings.filterwarnings('ignore')

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_string("cifar_dir", "data/person/", "文件的目录")

def imgread(filelist):

    # 1，构造图片文件的队列

    file_queue = tf.train.string_input_producer(filelist)

    # 2，构造图片阅读器读取队列数据（按一张）

    reader = tf.WholeFileReader()

    # 3, 读取图片数据并进行解码

    key,value = reader.read(file_queue)

    image = tf.image.decode_jpeg(value)

    # 4，处理图片数据的大小

    image_resize = tf.image.resize_images(image,[200,200])

    print(image_resize)

    image_resize.set_shape([200,200,3])

    print(image_resize)

    # 5，批处理

    image_batch = tf.train.batch([image_resize],batch_size=7,num_threads=1,capacity=3)

    return image_batch

if __name__ == '__main__':

    file_name = os.listdir(FLAGS.cifar_dir)

    filelist = [os.path.join(FLAGS.cifar_dir, file) for file in file_name]

    image_batch = imgread(filelist)

    with tf.Session() as sess:

        coord = tf.train.Coordinator()

        threads = tf.train.start_queue_runners(sess,coord=coord)

        print(sess.run([image_batch]))

        coord.request_stop()

        coord.join(threads)

这里data/person下的图片如下:

TensorFlow笔记-图片读取的更多相关文章

TensorFlow笔记-文件读取
小数量数据读取这些只用于可以完全加载到内存中的小型数据集: 1,储存在常数中 2,储存在变量中,初始化后,永远不改变它的值使用常量 training_data = ... training_lab ...
【学习笔记】tensorflow图片读取
目录图像基本概念图像基本操作图像基本操作API 图像读取API 狗图片读取 CIFAR-10二进制数据读取 TFRecords TFRecords存储 TFRecords读取方法图像基本概念 ...
（第二章第二部分）TensorFlow框架之读取图片数据
系列博客链接: (第二章第一部分)TensorFlow框架之文件读取流程:https://www.cnblogs.com/kongweisi/p/11050302.html 本文概述: 目标说明图片 ...
OpenCV笔记（1）(图片读取与现实、色彩空间、基础运算、均值方差、逻辑运算、泛洪填充、均值中值及自定义平滑)
一.图片读取和显示 import cv2 as cv # 图片读取cv.imread(img_path) car_img = cv.imread("car1.png") # 图片显 ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...
tensorflow笔记：多层LSTM代码分析
tensorflow笔记:多层LSTM代码分析标签(空格分隔): tensorflow笔记 tensorflow笔记系列: (一) tensorflow笔记:流程,概念和简单代码注释 (二) ten ...
tensorflow之数据读取探究(2)
tensorflow之tfrecord数据读取 Tensorflow关于TFRecord格式文件的处理.模型的训练的架构为: 1.获取文件列表.创建文件队列:http://blog.csdn.net/ ...
TensorFlow笔记-01-开篇概述
人工智能实践:TensorFlow笔记-01-开篇概述从今天开始,从零开始学习TensorFlow,有相同兴趣的同志,可以互相学习笔记,本篇是开篇介绍 Tensorflow,已经人工智能领域的一些名 ...

随机推荐

Delphi Thread.Queue与Synchronize的区别（差别: Synchronize是阻塞，Queue是非阻塞）
前话: 其实大家要学会看源码, 我接下来要说的这些东东,与其等别人讲,还不如自己搞几个代码试一下,印象还深刻点 TThread.Queue和TThread.Synchronize的区别, 效果上:二 ...
D7下FastMM的使用
原文出处:http://hi.baidu.com/showwindows/blog/item/5b7ac601c487c605728da573.html FastMM 快速MM:-),在D2006和2 ...
为什么你有10年经验，但成不了专家？（重复性刻意训练+反馈修正，练习的精髓是要持续地做自己做不好的，太精彩了）真正的高手都有很强的自学能力，老师和教练的最重要作用是提供即时的反馈（莫非我从小到大学习不好的原因在这里？没有单独刻意训练？） good
也许简单看书就是没有刻意训练.更没有反馈,所以没有效果我倒是想起自己,研究VCL源码的时候,都是自己给自己提问,然后苦思冥想.自己解决问题,然后Windows编程水平果然上了一个台阶.对什么叫做“框 ...
Elasticsearch ML
Elastic公司在收购了Prelert半年之后,终于在Elasticsearch 5中推出了Machine Learning功能.Prelert本身就擅长做时序性数据的异常检测,从这点上讲也比较契合 ...
关于JDK和JRE的一些总结
一.关于JDK和JRE JDK (Java Development Kit)即java开发工具,包括JER及代码编译器(javac).文档注释器(JavaDoc).代码调试器(Java Debugge ...
深入理解Java G1垃圾收集器
本文首先简单介绍了垃圾收集的常见方式,然后再分析了G1收集器的收集原理,相比其他垃圾收集器的优势,最后给出了一些调优实践. 一,什么是垃圾回收首先,在了解G1之前,我们需要清楚的知道,垃圾回收是什么 ...
ElasticSearch2.3.1环境搭建哪些不为人知的坑
首先说明一点,大家最好不要用什么尝鲜版,用比稳定版就好了,要不麻烦不断,另外出了问题,最好去官网,或者google搜索,因为这样靠谱些,要不现在好多都是低版本的,1.4的什么的,结果按照安装,多少情况 ...
对shell脚本进行加密
用shell脚本对系统进行自动化维护,简单,便捷而且可移植性好.但shell脚本是可读写的,很有可能会泄露敏感信息,如用户名,密码,路径,IP等.同样,在shell脚本运行时会也泄露敏感信息.请问如何 ...
Azkaban —— 编译及部署
一.Azkaban 源码编译 1.1 下载并解压 Azkaban 在3.0版本之后就不提供对应的安装包,需要自己下载源码进行编译. 下载所需版本的源码,Azkaban的源码托管在GitHub上,地址为 ...
Salesforce LWC学习(二) helloWorld程序在VSCode中的实现
上一篇我们简单的描述了一下Salesforce DX的配置以及CLI的简单功能使用,此篇主要简单描述一下LWC如何实现helloWorld以及LWC开发时应该注意的一些规范. 做国内项目的同学直观的感 ...

TensorFlow笔记-图片读取