（第二章第二部分）TensorFlow框架之读取图片数据

系列博客链接：

（第二章第一部分）TensorFlow框架之文件读取流程：https://www.cnblogs.com/kongweisi/p/11050302.html

本文概述：

目标
- 说明图片数字化的三要素
- 说明图片三要素与张量的表示关系
- 了解张量的存储和计算类型
- 应用tf.image.resize_images实现图像的像素改变
- 应用tf.train.start_queue_runners实现读取线程开启
- 应用tf.train.Coordinator实现线程协调器开启
- 应用tf.train.batch实现数据的批处理
应用
- 商品图片读取

1、图像基本知识

对于图像文件，我们怎么进行转换成机器学习能够理解的数据。对于图片来讲，组成图片的最基本单位是像素，所以我们获取的是每张图片的像素值。接触的图片有两种，一种是黑白图片，另一种是彩色图片。

1.1 图片三要素

组成一张图片特征值是所有的像素值，有这么几个要素。图片长度、图片宽度、图片通道数。什么是图片的通道数呢，描述一个像素点，如果是灰度，那么只需要一个数值来描述它，就是单通道。如果一个像素点，有RGB三种颜色来描述它，就是三通道。那所以

灰度图片：单通道
彩色图片：三通道

假设一张彩色图片的长200，宽200，通道数为3，那么总的像素数量为200x200x3

1.2 张量形状

读取图片之后，怎么用张量形状来表示呢。一张图片就是一个3D张量，[height, width, channel]，height就表示高，width表示宽，channel表示通道数。我们会经常遇到3D和4D的表示

单个图片：[height, width, channel]
多个图片（4D）：[batch, height, width, channel]，batch表示批数量

1.3 图片特征值处理

在进行图片识别的时候，每个图片样本的特征数量要保持相同（方便神经网络的训练）。所以需要将所有图片张量大小统一转换。另一方面如果图片的像素量太大，也可以通过这种方式适当减少像素的数量，减少训练的计算开销

tf.image.resize_images(images, size)
- 缩小放大图片
- images：4-D形状[batch, height, width, channels]，或3-D形状的张量[height, width, channels]的图片数据
- size：1-D int32张量：new_height, new_width，图像的新尺寸
- 返回4-D格式或者3-D格式图片

1.4 数据格式

存储：uint8(节约空间)
矩阵计算：float32(提高精度)

2、案例：商品图片读取

2.1 读取流程分析

构造图片文件队列
读取图片数据并进行解码
处理图片数据形状，批处理返回
开启会话线程运行

2.2 代码

def picture_read(file_list):

    """

    商品图片读取，转换成数据张量

    :return:

    """

    # 1、构造文件队列

    # 返回文件队列

    file_queue = tf.train.string_input_producer(file_list)

    # 2、构造一个图片读取器，去文件队列中读取数据

    # 返回reader实例，调用read方法读取内容，key, value

    reader = tf.WholeFileReader()

    key, value = reader.read(file_queue)

    print(value)

    # 3、对样本内容进行解码

    image = tf.image.decode_jpeg(value)

    print(image)

    # 处理图片的大小，形状，resize_images图片数据类型变成了float类型，所有图片大小都变成了200x200的

    image_resize = tf.image.resize_images(image, [200, 200])

    print(image_resize)

    # 设置固定形状，这里可以使用静态形状API去修改

    image_resize.set_shape([200, 200, 3])

    # 4、批处理图片数据

    # 每个样本的形状必须全部定义，否则会报错

    image_batch = tf.train.batch([image_resize], batch_size=100, num_threads=1, capacity=100)

    print(image_batch)

    return image_batch

会话逻辑

if __name__ == "__main__":

    # 生成路径+文件名的列表

    filename = os.listdir("./data/dog/")

    # 路径+名字拼接

    file_list = [os.path.join("./data/dog/", file) for file in filename]

    # 从原始二进制文件读取

    image_batch = picture_read(file_list)

    # 开启会话打印内容

    with tf.Session() as sess:

        # 创建线程协调员

        coord = tf.train.Coordinator()

        # 开启子线程去读取数据

        # 返回子线程实例

        threads = tf.train.start_queue_runners(sess=sess, coord=coord)

        # 获取样本数据去训练

        print(sess.run(image_batch)

        # 关闭子线程，回收

        coord.request_stop()

        coord.join(threads)

（第二章第二部分）TensorFlow框架之读取图片数据的更多相关文章

（第二章第三部分）TensorFlow框架之读取二进制数据
系列博客链接: (第二章第一部分)TensorFlow框架之文件读取流程:https://www.cnblogs.com/kongweisi/p/11050302.html (第二章第二部分)Tens ...
Ionic 入门与实战之第二章第二节：Ionic 环境搭建之 Ionic Lab 使用
原文发表于我的技术博客本文是「Ionic 入门与实战」系列连载的第二章第二节,主要对 Ionic Lab 工具作了介绍,并讲解了其使用方法,这也是一个开发 Ionic 比较好的调试工具. 原文发表于 ...
ios 向sqlite数据库插入和读取图片数据
向sqlite数据库插入和读取图片数据 (for ios) 假定数据库中存在表 test_table(name,image), 下面代码将图片文件test.png的二进制数据写到sqlite数据库: ...
第二章第二个spring-boot程序
上一节的代码是spring-boot的入门程序,也是官方文档上的一个程序.这一节会引入spring-boot官方文档推荐的方式来开发代码,并引入我们在spring开发中service层等的调用. 1. ...
第二章第二个spring-boot程序(转载)
本编博客转发自:http://www.cnblogs.com/java-zhao/p/5336369.html 上一节的代码是spring-boot的入门程序,也是官方文档上的一个程序.这一节会引入s ...
第二章——第二节 IPC机制的概述和使用
一.Serialiable与Paracle ①.作用 ②.使用二.Binder与AIDL ①.各自的作用三.如何使用IPC机制举例四.IPC机制的原理 ①.流程图 ②.自己编译自动生成 ...
《数据结构与算法Python语言描述》习题第二章第二题（python版）
ADT Date: #定义日期对象的抽象数据类型 Date(self, int year, int month, int day) #构造表示year/month/day的对象 difference( ...
Spring3实战第二章第二小节 IOC依赖注入 list和map集合
Spring有多种依赖注入的形式,本篇文章仅介绍Spring通过xml进行IOC配置的方式. 1.Set注入 2.构造器注入平常的Java开发中,程序员在某个类中需要依赖其它类的方法. 通常是new ...
tensorflow2.0学习笔记第二章第二节
2.2复杂度和学习率指数衰减学习率可以先用较大的学习率,快速得到较优解,然后逐步减少学习率,使得模型在训练后期稳定指数衰减学习率 = 初始学习率 * 学习率衰减率^(当前轮数/多少轮衰减一次) 空间 ...

随机推荐

HowToDoInJava 其它教程 2 · 翻译完毕
原文:HowToDoInJava 协议:CC BY-NC-SA 4.0 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远. ApacheCN 学习资源目录 JMS 教程 JMS 教 ...
git merge -ff --no-ff --squash 的区别
感谢原文作者:futureme 原文链接:https://www.cnblogs.com/taylorluo/articles/10810762.html git merge #没有参数(默认为–ff ...
sublime配置大全
配置:Preferences→Settings-User 字体和字体大小 "font_face": "YaHei Consolas Hybrid", " ...
js trim()方法
从字符串中移除前导空格.尾随空格和行终止符. 语法 stringObj.trim() 参数 stringObj 必选.String 对象或字符串.trim 方法不修改该字符串. 返回值已移除前导空格 ...
linux下打包所有文件，包括隐藏文件到压缩包
命令如下: cd /root/test/ tar czvf test.tar.gz .[!.]* * 解释: tar czvf test.tar.gz * 压缩当前文件夹下非[隐藏文件]的文件 tar ...
NoSQL之Redis配置与优化
NoSQL之Redis配置与优化目录 NoSQL之Redis配置与优化一.关系数据库和非关系数据库 1. 关系型数据库 2. 非关系型数据库 3. 非关系型数据库产生背景 4. 关系型数据库和非关 ...
HMS Core助力宝宝巴士为全球开发者展现高品质儿童数字内容
本文分享于HMS Core开发者论坛<宝宝巴士携HMS Core为全球家庭用户提供优质儿童数字内容>采访稿整理宝宝巴士是国内有着十多年出海经验的开发者,其旗下有超过200多款儿童益智互动 ...
.NET 固定时间窗口算法实现（无锁线程安全）
一.前言最近有一个生成 APM TraceId 的需求,公司的APM系统的 TraceId 的格式为:APM AgentId+毫秒级时间戳+自增数字,根据此规则生成的 Id 可以保证全局唯一(有 N ...
Solution Set -「LOCAL」冲刺省选 Round XXIII
\(\mathscr{Summary}\) 有一说一,虽然我炸了,但这场锻炼心态的效果真的好.部分分聊胜于无,区分度一题制胜,可谓针对性强的好题. A 题,相对性签到题.这个建图确实巧妙,多见 ...
Solution -「CF 494C」Helping People
\(\mathcal{Description}\) Link. 给定序列 \(\{a_n\}\) 和 \(m\) 个操作,第 \(i\) 个操作有 \(p_i\) 的概率将 \([l_i,r_ ...