Tensorflow细节-P199-数据集

数据集的基本使用方法

import tempfile

import tensorflow as tf

input_data = [1, 2, 3, 5, 8]  # 这不是列表吗，为什么书里叫数组

dataset = tf.data.Dataset.from_tensor_slices(input_data)  # 这是构建Dataset内存中的数据

# 定义迭代器。

iterator = dataset.make_one_shot_iterator()

# get_next() 返回代表一个输入数据的张量。

x = iterator.get_next()

y = x * x

with tf.Session() as sess:

    for i in range(len(input_data)):

        print(sess.run(y))

先生成两个文件：file1,file2

import tempfile

import tensorflow as tf

# 创建文本文件作为本例的输入。

with open("./test1.txt", "w") as file:

    file.write("File1, line1.\n")

    file.write("File1, line2.\n")

with open("./test2.txt", "w") as file:

    file.write("File2, line1.\n")

    file.write("File2, line2.\n")

再读取两个文件并放到一个dataset,然后输出（注意iterator。get_next()获得的是张量）

import tempfile

import tensorflow as tf

# 从文本文件创建数据集。这里可以提供多个文件。

input_files = ["./text1.txt", "./text2.txt"]

dataset = tf.data.TextLineDataset(input_files)  # 注意，注意，这里换了，

# tf.data.Dataset.from_tensor_slices(input_data) 是读取数变为张量

# 定义迭代器。

iterator = dataset.make_one_shot_iterator()

# 这里get_next()返回一个字符串类型的张量，代表文件中的一行。

# 注意，张量，张量，凡是iterator出来的都是张量

x = iterator.get_next()

with tf.Session() as sess:

    for i in range(4):

        print(sess.run(x))

TFRecoard读取：

import tempfile

import tensorflow as tf

# 以下解析TFRecord文件里的数据。读取文件为本章第一节创建的文件

def parser(record):

    features = tf.parse_single_example(

        record,

        features={

            'image_raw': tf.FixedLenFeature([], tf.string),

            'pixels': tf.FixedLenFeature([], tf.int64),

            'label': tf.FixedLenFeature([], tf.int64)

        }

    )

    decoded_images = tf.decode_raw(features['image_raw'], tf.uint8)

    retyped_images = tf.cast(decoded_images, tf.float32)

    images = tf.reshape(retyped_images, [784])

    labels = tf.cast(features['label'], tf.int32)

    pixels = tf.cast(features['pixels'], tf.int32)

    return images, labels, pixels

# 从TFRecord文件创建数据集。这里可以提供多个文件。

input_files = ["output.tfrecords"]

dataset = tf.data.TFRecordDataset(input_files)  # 看，看，看，这次又换了

# map()函数表示对数据集中的每一条数据进行调用解析方法。

dataset = dataset.map(parser)  # 这是一个很常用的套路，要学会， 表示对dataset中的数据进行parser操作

# 定义遍历数据集的迭代器。

iterator = dataset.make_one_shot_iterator()

# 读取数据，可用于进一步计算

image, label, _ = iterator.get_next()

with tf.Session() as sess:

    for i in range(10):

        x, y = sess.run([image, label])

        print(y)

结果为：

下面是用到placeholder的操作，因为是placeholder所以要initializer，所以使用了iterator = dataset.make_initializable_iterator()

还有一个点，在Session下要用 sess.run(iterator. feed_dict={input_files: ["output.tfrecords"]})

import tempfile

import tensorflow as tf

# 以下为使用initializable_iterator来动态初始化数据集

def parser(record):

    features = tf.parse_single_example(

        record,

        features={

            'image_raw':tf.FixedLenFeature([],tf.string),

            'pixels':tf.FixedLenFeature([],tf.int64),

            'label':tf.FixedLenFeature([],tf.int64)

        })

    decoded_images = tf.decode_raw(features['image_raw'],tf.uint8)

    retyped_images = tf.cast(decoded_images, tf.float32)

    images = tf.reshape(retyped_images, [784])

    labels = tf.cast(features['label'],tf.int32)

    #pixels = tf.cast(features['pixels'],tf.int32)

    return images, labels

# 从TFRecord文件创建数据集，具体文件路径是一个placeholder，稍后再提供具体路径。

input_files = tf.placeholder(tf.string)

dataset = tf.data.TFRecordDataset(input_files)

dataset = dataset.map(parser)

# 定义遍历dataset的initializable_iterator。

# 因为前面的例子使用了最简单的one_shot_iterator来遍历数据集，数据集的所有参数必须是确定的，

# 如果需要placeholder来初始化数据集， 那就需要用到initializable_iterator

iterator = dataset.make_initializable_iterator()

image, label = iterator.get_next()

with tf.Session() as sess:

    # 首先初始化iterator，并给出input_files的值。

    sess.run(iterator.initializer,

             feed_dict={input_files: ["output.tfrecords"]})

    # 遍历所有数据一个epoch。当遍历结束时，程序会抛出OutOfRangeError。

    while True:

        try:

            x, y = sess.run([image, label])

        except tf.errors.OutOfRangeError:

            break

Tensorflow细节-P199-数据集的更多相关文章

一个简单的TensorFlow可视化MNIST数据集识别程序
下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...
[PocketFlow]解决TensorFLow在COCO数据集上训练挂起无输出的bug
1. 引言因项目要求,需要在PocketFlow中添加一套PeleeNet-SSD和COCO的API,具体为在datasets文件夹下添加coco_dataset.py, 在nets下添加pelee ...
学习笔记TF056:TensorFlow MNIST，数据集、分类、可视化
MNIST(Mixed National Institute of Standards and Technology)http://yann.lecun.com/exdb/mnist/ ,入门级计算机 ...
基于TensorFlow的MNIST数据集的实验
一.MNIST实验内容 MNIST的实验比较简单,可以直接通过下面的程序加上程序上的部分注释就能很好的理解了,后面在完善具体的相关的数学理论知识,先记录在这里: 代码如下所示: import tens ...
深度学习原理与框架-Tensorflow基本操作-mnist数据集的逻辑回归 1.tf.matmul(点乘操作) 2.tf.equal(对应位置是否相等) 3.tf.cast(将布尔类型转换为数值类型) 4.tf.argmax(返回最大值的索引) 5.tf.nn.softmax(计算softmax概率值) 6.tf.train.GradientDescentOptimizer(损失值梯度下降器)
1. tf.matmul(X, w) # 进行点乘操作参数说明:X,w都表示输入的数据, 2.tf.equal(x, y) # 比较两个数据对应位置的数是否相等,返回值为True,或者False 参 ...
TensorFlow 训练MNIST数据集（2）—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...
TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络
1.MNIST数据集简介首先通过下面两行代码获取到TensorFlow内置的MNIST数据集: from tensorflow.examples.tutorials.mnist import inp ...
基于 tensorflow 的 mnist 数据集预测
1. tensorflow 基本使用方法 2. mnist 数据集简介与预处理 3. 聚类算法模型 4. 使用卷积神经网络进行特征生成 5. 训练网络模型生成结果 how to install ten ...
TensorFlow 下 mnist 数据集的操作及可视化
from tensorflow.examples.tutorials.mnist import input_data 首先需要连网下载数据集: mnsit = input_data.read_data ...
Tensorflow细节-P202-数据集的高层操作
本节是对上节的补充 import tempfile import tensorflow as tf # 输入数据使用本章第一节(1. TFRecord样例程序.ipynb)生成的训练和测试数据. tr ...

随机推荐

Connection to api@localhost failed. [08001] Could not create connection to d
pycharm 换成2019之后连接数据库用户名密码数据库名字都没错,就是连接不上去,网上百度一下,试试将URL后面拼接 ?useSSL=false&serverTimezone=UTC 发现 ...
C++ 制作一个“测运”小游戏-rand()函数的应用
游戏说明: 游戏名:Lucky Guy 玩法说明:有2种模式可以选择,一种是一直选择数字,直到抽到炸弹为止.另一种是在0~9个数字中进行选择,有5个炸弹,最高分为5,抽到炸弹即游戏结束.游戏结束后,可 ...
font-svg
https://fontawesome.com/ http://www.fontawesome.com.cn/cheatsheet/ http://www.iconfont.cn/ string lj ...
修改Excel脚本
批量修改Excel TODO: 批量修改Excel 功能: 将图片防止在本地,读取excel数据,拆分数据之后根本地照片名称对比,然后上传服务器,创建新得excel. #!/usr/bin/pytho ...
String 字符串的==和eqauls区别
1.对于基本类型来说,==比较的是数据的值,equals方法也是数据的值: 对于引用类型来说,==比较的是引用的地址,equals方法比较的是对象的内容. 2.String是引用类型,用“=”创建字符 ...
VBA 字符串-相关函数（1-5）
Instr()函数 InStr()函数返回一个字符串第一次出现在一个字符串,从左到右搜索.返回搜索到的字符索引位置. 语法 InStr([start,]string1,string2[,compare ...
excel2016打开为空白界面解决办法
前言 excel2016打开文件为空白的界面,明显不正常. 解决方法 https://blog.csdn.net/b2345012/article/details/94134401 以上.
【代码片段】定时记录CPU使用率并保存为CSV
原文链接 : [https://blog.zhoutao123.com/#/blog/article/64])(https://blog.zhoutao123.com/#/blog/article/6 ...
Java 进阶面试问题必备
面向对象编程的基本理念与核心设计思想解释下多态性(polymorphism),封装性(encapsulation),内聚(cohesion)以及耦合(coupling). 继承(Inheritanc ...
git学习记录--标签随笔
创建标签: 命令git tag <name>用于新建一个标签,默认为HEAD,也可以指定一个commit id: git tag -a <tagname> -m "b ...

Tensorflow细节-P199-数据集

数据集的基本使用方法

Tensorflow细节-P199-数据集的更多相关文章

随机推荐

热门专题