Tensorflow细节-P202-数据集的高层操作

本节是对上节的补充

import tempfile

import tensorflow as tf

# 输入数据使用本章第一节（1. TFRecord样例程序.ipynb）生成的训练和测试数据。

train_files = tf.train.match_filenames_once("output.tfrecords")

test_files = tf.train.match_filenames_once("output_test.tfrecords")

def parser(record):

    features = tf.parse_single_example(

        record,

        features={

            'image_raw': tf.FixedLenFeature([], tf.string),

            'pixels': tf.FixedLenFeature([], tf.int64),

            'label': tf.FixedLenFeature([], tf.int64)

        }

    )

    decoded_images = tf.decode_raw(features['image_raw'], tf.uint8)

    retyped_images = tf.cast(decoded_images, tf.float32)

    images = tf.reshape(retyped_images, [784])

    labels = tf.cast(features['label'], tf.int32)

    # pixels = tf.cast(features['pixels'],tf.int32)

    return images, labels

image_size = 299          # 定义神经网络输入层图片的大小。

batch_size = 100          # 定义组合数据batch的大小。

shuffle_buffer = 10000   # 定义随机打乱数据时buffer的大小。

# 定义读取训练数据的数据集。

dataset = tf.data.TFRecordDataset(train_files)

dataset = dataset.map(parser)  # 哈哈哈，这里看懂了

# 对数据进行shuffle和batching操作。这里省略了对图像做随机调整的预处理步骤。

dataset = dataset.shuffle(shuffle_buffer).batch(batch_size)

# 重复NUM_EPOCHS个epoch。

NUM_EPOCHS = 10

dataset = dataset.repeat(NUM_EPOCHS)

# 定义数据集迭代器。

iterator = dataset.make_initializable_iterator()

image_batch, label_batch = iterator.get_next()

# 定义神经网络的结构以及优化过程。这里与7.3.4小节相同。

def inference(input_tensor, weights1, biases1, weights2, biases2):

    layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)

    return tf.matmul(layer1, weights2) + biases2

INPUT_NODE = 784

OUTPUT_NODE = 10

LAYER1_NODE = 500

REGULARAZTION_RATE = 0.0001

TRAINING_STEPS = 5000

weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE], stddev=0.1))

biases1 = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))

weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1))

biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

y = inference(image_batch, weights1, biases1, weights2, biases2)

# 计算交叉熵及其平均值

cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=label_batch)

cross_entropy_mean = tf.reduce_mean(cross_entropy)

# 损失函数的计算

regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)

regularaztion = regularizer(weights1) + regularizer(weights2)

loss = cross_entropy_mean + regularaztion

# 优化损失函数

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

# 下面是测试用的

# 定义测试用的Dataset。

test_dataset = tf.data.TFRecordDataset(test_files)

test_dataset = test_dataset.map(parser)

test_dataset = test_dataset.batch(batch_size)

# 定义测试数据上的迭代器。

test_iterator = test_dataset.make_initializable_iterator()

test_image_batch, test_label_batch = test_iterator.get_next()

# 定义测试数据上的预测结果。

test_logit = inference(test_image_batch, weights1, biases1, weights2, biases2)

predictions = tf.argmax(test_logit, axis=-1, output_type=tf.int32)

# 声明会话并运行神经网络的优化过程。

with tf.Session() as sess:

    # 初始化变量。

    sess.run((tf.global_variables_initializer(),

              tf.local_variables_initializer()))  # tf.local_variables_initializer()返回一个初始化所有局部变量的操作（Op）

    # 初始化训练数据的迭代器。

    sess.run(iterator.initializer)

    # 循环进行训练，直到数据集完成输入、抛出OutOfRangeError错误。

    while True:

        try:

            sess.run(train_step)

        except tf.errors.OutOfRangeError:

            break

    test_results = []

    test_labels = []

    # 初始化测试数据的迭代器。

    sess.run(test_iterator.initializer)

    # 获取预测结果。

    while True:

        try:

            pred, label = sess.run([predictions, test_label_batch])

            test_results.extend(pred)

            test_labels.extend(label)

        except tf.errors.OutOfRangeError:

            break

# 计算准确率

correct = [float(y == y_) for (y, y_) in zip(test_results, test_labels)]

accuracy = sum(correct) / len(correct)

print("Test accuracy is:", accuracy)

运行结果是：

Tensorflow细节-P202-数据集的高层操作的更多相关文章

TensorFlow数据集（二）——数据集的高层操作
参考书 <TensorFlow:实战Google深度学习框架>(第2版) 一个使用数据集进行训练和测试的完整例子. #!/usr/bin/env python # -*- coding: ...
一个简单的TensorFlow可视化MNIST数据集识别程序
下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...
吴裕雄 python 神经网络——TensorFlow 数据集高层操作
import tempfile import tensorflow as tf train_files = tf.train.match_filenames_once("E:\\output ...
深度学习原理与框架-Tensorflow基本操作-mnist数据集的逻辑回归 1.tf.matmul(点乘操作) 2.tf.equal(对应位置是否相等) 3.tf.cast(将布尔类型转换为数值类型) 4.tf.argmax(返回最大值的索引) 5.tf.nn.softmax(计算softmax概率值) 6.tf.train.GradientDescentOptimizer(损失值梯度下降器)
1. tf.matmul(X, w) # 进行点乘操作参数说明:X,w都表示输入的数据, 2.tf.equal(x, y) # 比较两个数据对应位置的数是否相等,返回值为True,或者False 参 ...
吴裕雄--天生自然 pythonTensorFlow图形数据处理：数据集高层操作
import tempfile import tensorflow as tf # 1. 列举输入文件. # 输入数据生成的训练和测试数据. train_files = tf.train.match_ ...
TensorFlow 下 mnist 数据集的操作及可视化
from tensorflow.examples.tutorials.mnist import input_data 首先需要连网下载数据集: mnsit = input_data.read_data ...
Tensorflow细节-P319-使用GPU基本的操作
如果什么都不加,直接运行装了GPU的Tensorflow,结果是这样子的 import tensorflow as tf a = tf.constant([1.0, 2.0, 3.0], shape= ...
[PocketFlow]解决TensorFLow在COCO数据集上训练挂起无输出的bug
1. 引言因项目要求,需要在PocketFlow中添加一套PeleeNet-SSD和COCO的API,具体为在datasets文件夹下添加coco_dataset.py, 在nets下添加pelee ...
学习笔记TF056:TensorFlow MNIST，数据集、分类、可视化
MNIST(Mixed National Institute of Standards and Technology)http://yann.lecun.com/exdb/mnist/ ,入门级计算机 ...

随机推荐

一起来学Spring Cloud | 第七章：分布式配置中心(Spring Cloud Config)
上一章节,我们讲解了服务网关zuul,本章节我们从git和本地两种存储配置信息的方式来讲解springcloud的分布式配置中心-Spring Cloud Config. 一.Spring Cloud ...
REST framework之分页组件
REST framework之分页组件一简单分页查看第n页,每页显示n条 from rest_framework.pagination import PageNumberPagination # ...
【IDEA使用技巧】（4） —— IDEA 构建Java Maven项目、导入Eclipse项目、多Module Maven项目
1.IntelliJ IDEA构建Java Maven项目 1.1. IDEA构建Java Maven项目 ①选择Create New Project,选择创建Maven项目,并勾选Create fr ...
我的Vue朝圣之路1
1. Vue是什么? 1). 一位华裔前Google工程师开发的前端js库 2). 一个MVVM框架 3). 核心概念 * 数据绑定 ...
Maven过滤属性文件，替换属性值
pom.xml 1.resources: resources中是定义哪些目录下的文件会被配置文件中定义的变量替换,一般我们会把项目的配置文件放在src/main/resources下,像db,bean ...
Unity的学习笔记（UGUI文本逐个字输出）
之前在网上找过各种的逐个输出字,我可能理解能力不好,照着代码复制没有能使用成功,于是自己研究了很多网上说的思路,各种改良出了一个能用的,写完自己测试,觉得还真好用,于是记录下来用法:将用代码组件挂上 ...
java之初识hibernate
1. 使用jdbc进行数据库操作:获取数据库连接,编写sql语句,执行sql操作,关闭连接. 比如:每次创建连接,释放资源----使的执行效率降低: 解决方案:连接池. 编写sql语句动作----简单 ...
Linux环境Ubuntu上安装GitLab
本文主要介绍在Ubuntu[Ubuntu 18.04.3]上安装最新的GitLab版本控制工具. 一.安装更新GitLab所需要的依赖项 sudo apt-get update 下载过程中,网络要有所 ...
修复win10系统的引导
上周末时,在安装完linux后,进入win10系统后,想做个系统的引导菜单,用了easyBCD,后来一不小心删除了win10的引导菜单(window boot manager). 这样,就造成了我wi ...
【阅读笔记：散列表】Javascript任何对象都是一个散列表（hash表）！
什么是散列表? 散列表是Dictionary(字典)的一种散列表实现方式,字典传送门一个很常见的应用是使用散列表来表示对象.Javascript语言内部就是使用散列表来表示每个对象.此时,对象的每个 ...

Tensorflow细节-P202-数据集的高层操作

本节是对上节的补充

Tensorflow细节-P202-数据集的高层操作的更多相关文章

随机推荐

热门专题