TensorFlow多线程输入数据处理框架（二）—

参考书

《TensorFlow：实战Google深度学习框架》（第2版）

一个简单的程序来生成样例数据。

#!/usr/bin/env python

# -*- coding: UTF-8 -*-

# coding=utf-8 

"""

@author: Li Tian

@contact: 694317828@qq.com

@software: pycharm

@file: sample_data_produce1.py

@time: 2019/2/3 21:46

@desc: 一个简单的程序来生成样例数据

"""

import tensorflow as tf

# 创建TFRecord文件的帮助函数

def _int64_feature(value):

    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))

# 模拟海量数据情况下将数据写入不同的文件。num_shards定义了总共写入多少个文件

# instances_per_shard定义了每个文件中有多少个数据

num_shards = 2

instances_per_shard = 2

for i in range(num_shards):

    # 将数据分为多个文件时，可以将不同文件以类似0000n-of-0000m的后缀区分。其中m表示了

    # 数据总共被存在了多少个文件，n表示当前文件的编号。式样的方式既方便了通过正则表达式

    # 获取文件列表，又在文件名中加入了更多的信息。

    filename = ('./data.tfrecords-%.5d-of-%0.5d' % (i, num_shards))

    writer = tf.python_io.TFRecordWriter(filename)

    # 将数据封装成Example结构并写入TFRecord文件

    for j in range(instances_per_shard):

        # Example结构仅包含当前样例属于第几个文件以及是当前文件的第几个样本

        example = tf.train.Example(features=tf.train.Features(feature={

            'i': _int64_feature(i),

            'j': _int64_feature(j)

        }))

        writer.write(example.SerializeToString())

    writer.close()

运行结果：

展示了tf.train.match_filenames_once函数和tf.train.string_input_producer函数的使用方法。

#!/usr/bin/env python

# -*- coding: UTF-8 -*-

# coding=utf-8 

"""

@author: Li Tian

@contact: 694317828@qq.com

@software: pycharm

@file: sample_data_deal1.py

@time: 2019/2/3 22:00

@desc: 展示了tf.train.match_filenames_once函数和tf.train.string_input_producer函数的使用方法

"""

import tensorflow as tf

# 使用tf.train.match_filenames_once函数获取文件列表

files = tf.train.match_filenames_once('./data.tfrecords-*')

# 通过tf.train.string_input_producer函数创建输入队列，输入队列中的文件列表为

# tf.train.match_filenames_once函数获取的文件列表。这里将shuffle参数设为False

# 来避免随机打乱读文件的顺序。但一般在解决真实问题时，会将shuffle参数设置为True

filename_queue = tf.train.string_input_producer(files, shuffle=False)

# 如前面所示读取并解析一个样本

reader = tf.TFRecordReader()

_, serialized_example = reader.read(filename_queue)

features = tf.parse_single_example(

    serialized_example,

    features={

        'i': tf.FixedLenFeature([], tf.int64),

        'j': tf.FixedLenFeature([], tf.int64),

    }

)

with tf.Session() as sess:

    # 虽然在本段程序中没有声明任何变量，但使用tf.train.match_filenames_once函数时

    # 需要初始化一些变量。

    tf.local_variables_initializer().run()

    print(sess.run(files))

    # 声明tf.train.Coordinator类来协同不同线程，并启动线程。

    coord = tf.train.Coordinator()

    threads = tf.train.start_queue_runners(sess=sess, coord=coord)

    # 多次执行获取数据的操作

    for i in range(6):

        print(sess.run([features['i'], features['j']]))

    # 请求处理的线程停止

    coord.request_stop()

    # 等待，直到处理的线程已经停止

    coord.join(threads)

运行结果：

TensorFlow多线程输入数据处理框架（二）——输入文件队列的更多相关文章

TensorFlow多线程输入数据处理框架（四）——输入数据处理框架
参考书 <TensorFlow:实战Google深度学习框架>(第2版) 输入数据处理的整个流程. #!/usr/bin/env python # -*- coding: UTF-8 -* ...
Tensorflow多线程输入数据处理框架（一）——队列与多线程
参考书 <TensorFlow:实战Google深度学习框架>(第2版) 对于队列,修改队列状态的操作主要有Enqueue.EnqueueMany和Dequeue.以下程序展示了如何使用这 ...
Tensorflow多线程输入数据处理框架
Tensorflow提供了一系列的对图像进行预处理的方法,但是复杂的预处理过程会减慢整个训练过程,所以,为了避免图像的预处理成为训练神经网络效率的瓶颈,Tensorflow提供了多线程处理输入数据的框 ...
TensorFlow多线程输入数据处理框架（三）——组合训练数据
参考书 <TensorFlow:实战Google深度学习框架>(第2版) 通过TensorFlow提供的tf.train.batch和tf.train.shuffle_batch函数来将单 ...
tensorflow学习笔记——多线程输入数据处理框架
之前我们学习使用TensorFlow对图像数据进行预处理的方法.虽然使用这些图像数据预处理的方法可以减少无关因素对图像识别模型效果的影响,但这些复杂的预处理过程也会减慢整个训练过程.为了避免图像预处理 ...
吴裕雄--天生自然 pythonTensorFlow图形数据处理：输入数据处理框架
import tensorflow as tf # 1. 创建文件列表,通过文件列表创建输入文件队列 files = tf.train.match_filenames_once("F:\\o ...
吴裕雄 python 神经网络——TensorFlow 输入数据处理框架
import tensorflow as tf files = tf.train.match_filenames_once("E:\\MNIST_data\\output.tfrecords ...
大数据处理框架之Strom：认识storm
Storm是分布式实时计算系统,用于数据的实时分析.持续计算,分布式RPC等. (备注:5种常见的大数据处理框架:· 仅批处理框架:Apache Hadoop:· 仅流处理框架:Apache Stor ...
Java 多线程基础（十二）生产者与消费者
Java 多线程基础(十二)生产者与消费者一.生产者与消费者模型生产者与消费者问题是个非常典型的多线程问题,涉及到的对象包括“生产者”.“消费者”.“仓库”和“产品”.他们之间的关系如下: ①.生 ...

随机推荐

C++ Primer 学习笔记与思考_7 void和void*指针的使用方法
(一)void的含义 void的字面意思是"无类型",void差点儿仅仅有"凝视"和限制程序的作用,由于从来没有人会定义一个void变量,让我们试着来定义: v ...
Spring官方文档翻译——15.1 介绍Spring Web MVC框架
Part V. The Web 文档的这一部分介绍了Spring框架对展现层的支持(尤其是基于web的展现层) Spring拥有自己的web框架--Spring Web MVC.在前两章中会有介绍. ...
win7 64位安装vs2013 出现'System.AccessViolationException的错误
用管理员身份运行CMD,输入netsh winsock reset并回车(注意,必须是已管理员身份运行,这个重置LSP连接)
一个简单的EBNF范式的实现
最近无事在看书的时候发现了这个东西刹那间突然觉得大学时候编译原理书上的的什么语法分析书.上下文无关等晦涩难懂的概念清晰了许多今天把它贴出来希望也能让你回想起些往事... 至于EBNF范式是什么东西,网 ...
基于第三方微信授权登录的iOS代码分析
本文转载至 http://www.cocoachina.com/ios/20140922/9715.html 微信已经深入到每一个APP的缝隙,最常用的莫过分享和登录了,接下来就以代码的形式来展开微信 ...
SSM整理笔记1——SSM网站初步功能设计
前言因为公司里一直用Hibernate,但是现在Mybatis是趋势,所以搭建一个Mybatis的网站框架,目的是:1摸清其功能特点,2为以后的项目增加框架选择(以前只用hibernate或者Spr ...
hadoop报JAVA_HOME is not set暂时解决办法
直接在etc/hadoop/hadoop-env.sh中 export JAVA_HOME=XXX
android adapter公共写法
在开发过程中,会写很多的adapter类,其中很多公共的部分,不需要每次都去书写,可以为开发者省下很多时间提取一个ListViewAdapter public abstract class List ...
redis09---redis 服务器端命令
redis 服务器端命令 db0,db1,db2是数据库,外层是服务器,服务器下面有20个数据库. :>time ) "" //多少秒 ) "" //多少 ...
sublime text2 相关插件及其应用
一.常见的插件 1.Emmet 'ctrl+up':切换文件: "ctrl+alt+enter":创建新的div标签: "shift+ctrl+." :查找相同 ...

TensorFlow多线程输入数据处理框架（二）——输入文件队列

参考书

运行结果：

运行结果：

TensorFlow多线程输入数据处理框架（二）——输入文件队列的更多相关文章

随机推荐

热门专题