Deep learning with PyTorch: A 60 minute blitz

第一章

1、什么是占位符和变量？

无论是占位符还是变量，都是tensor，tensor是tensorflow计算的节点。

占位符和变量是不同类型的tensor。占位符的值由用户自行传递，不依赖于其他tensor，通常用来存储样本数据和标签。

tf.Tensor类是核心类，占位符（tf.placeholder）和变量（tf.Variable）都可以看作特殊的tensor。

可以参阅http://www.tensorfly.cn/tfdoc/how_tos/variables.html

2、什么是会话？变量和占位符在会话中如何传递？

会话是一个核心概念，tensor是图计算的节点，会话是对这些节点进行计算的上下文。

变量是计算过程中可以改变的值的tensor，变量的值会被保存下来。在对变量进行操作前必须进行变量初始化，即在会话中保存变量的初始值。

训练时，每次提取一部分数据进行训练，把他们放入对应的占位符中，在会话中，不需要计算占位符的值，而是直接把占位符的值传递给会话。

会话中，变量的值会被保存下来，占位符的值不会被保存，每次可以给占位符传递不同的值。

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

# x是一个占位符，表示待识别的图片

# 形状是[None, 784]，None表示这一维的大小可以是任意的

x = tf.placeholder(tf.float32, [None, 784])

# 变量参数用tf.Variable

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

y = tf.nn.softmax(tf.matmul(x, W) + b)

# y_是一个占位符，表示实际的图像标签，独热表示

y_ = tf.placeholder(tf.float32, [None, 10])

# 交叉熵

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y)))

# 梯度下降，学习率是0.01

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

# 创建session，只有在session中才能运行优化步骤train_step

sess = tf.InteractiveSession()

# 运行之前必须要初始化所有变量，分配内存

tf.global_variables_initializer().run()

print('start training...')

for _ in range(1000):

    # batch_xs: (100, 784), batch_ys: (100, 10)

    batch_xs, batch_ys = mnist.train.next_batch(100)

    # sess中运行train_step，运行时要使用feed_dict传入对应占位符的值

    sess.run(train_step, feed_dict={x: batch_xs, y_:batch_ys})

3、计算图流程（画出思维导图）

# 独热表示的y_ 需要通过sess.run(y_)才能获取此tensor的值

print(tf.argmax(y, 1))

# output: Tensor("ArgMax:0", shape=(?,), dtype=int64)

print(tf.argmax(y_, 1))

# output: Tensor("ArgMax_1:0", shape=(?,), dtype=int64)

# tf.equal 比较是否相等，输出true和false

# tf.argmax(y,1), tf.argmax(y_,1), 取出数组中最大值的下标，可以用独热表示以及模型输出转换为数字标签

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))

# tf.cast 将比较值转换为float32型的变量，true转换为1，false转换为0

# tf.reduce_mean 计算数组中的所有元素的平均值，得到模型的预测准确率

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 使用全体测试样本预测，mnist.test.images, mnist.test.labels

print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))

# 只有输入了x，y_，通过sess.run才可以计算出correct_prediction，accuracy

4、扩展阅读

本章的两个MNIST 程序实际上来自于TensorFlow 官方的两个新手教程，地址为https://www.tensorflow.org/get_started/mnist/beginners 和 https://www.tensorflow.org/get_started/mnist/pros 。读者可以将本书的内容和官方的教程对照起来进行阅读。这两个新手教程的中文版地址为http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html 和http://www.tensorfly.cn/tfdoc/tutorials/mnist_pros.html。
本章简要介绍了TensorFlow 的tf.Tensor 类。tf.Tensor 类是TensorFlow的核心类，常用的占位符（tf.placeholder）、变量（tf.Variable）都可以看作特殊的Tensor。读者可以参阅https://www.tensorflow.org/programmers_guide/tensors 来更深入地学习它的原理。
常用tf.Variable 类来存储模型的参数，读者可以参阅https://www.tensorflow.org/programmers_guide/variables 详细了解它的运行机制，文档的中文版地址为http://www.tensorfly.cn/tfdoc/how_tos/ variables.html。
只有通过会话（Session）才能计算出tf.Tensor 的值。强烈建议读者在学习完tf.Tensor 和tf.Variable 后，阅读https://www.tensorflow.org/programmers_guide/graphs 中的内容，该文档描述了TensorFlow 中计算图和会话的基本运行原理，对理解TensorFlow 的底层原理有很大帮助。

第二章

tensorflow的数据读取原理

画出思维导图

Deep learning with PyTorch: A 60 minute blitz _note(1) Tensors的更多相关文章

DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | TENSORS
Tensor是一种特殊的数据结构,非常类似于数组和矩阵.在PyTorch中,我们使用tensor编码模型的输入和输出,以及模型的参数. Tensor类似于Numpy的数组,除了tensor可以在GPU ...
DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | TORCH.AUTOGRAD
torch.autograd 是PyTorch的自动微分引擎,用以推动神经网络训练.在本节,你将会对autograd如何帮助神经网络训练的概念有所理解. 背景神经网络(NNs)是在输入数据上执行的嵌 ...
DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | NEURAL NETWORKS
神经网络可以使用 torch.nn包构建. 现在你已经对autograd有所了解,nn依赖 autograd 定义模型并对其求微分.nn.Module 包括层,和一个返回 output 的方法 - f ...
DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | TRAINING A CLASSIFIER
你已经知道怎样定义神经网络,计算损失和更新网络权重.现在你可能会想, 那么,数据呢? 通常,当你需要解决有关图像.文本或音频数据的问题,你可以使用python标准库加载数据并转换为numpy arra ...
Summary on deep learning framework --- PyTorch
Summary on deep learning framework --- PyTorch Updated on 2018-07-22 21:25:42 import osos.environ[ ...
Neural Network Programming - Deep Learning with PyTorch with deeplizard.
PyTorch Prerequisites - Syllabus for Neural Network Programming Series PyTorch先决条件 - 神经网络编程系列教学大纲每个 ...
Neural Network Programming - Deep Learning with PyTorch - YouTube
百度云链接: 链接:https://pan.baidu.com/s/1xU-CxXGCvV6o5Sksryj3fA 提取码:gawn
(zhuan) Where can I start with Deep Learning?
Where can I start with Deep Learning? By Rotek Song, Deep Reinforcement Learning/Robotics/Computer V ...
rlpyt（Deep Reinforcement Learning in PyTorch）
rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch Github:https://github.com/ast ...

随机推荐

python解析库之 XPath
1. XPath (XML Path Language) XML路径语言 2. XPath 常用规则: nodename 选取此节点的所有子节点 / 从当前 ...
HDU：1251-统计难题（字典树模板，动态建树，静态建树）
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=1251 统计难题 Time Limit: 4000/2000 MS (Java/Others) Memor ...
NOIP 2017 小凯的疑惑
# NOIP 2017 小凯的疑惑思路 a,b 互质求最大不能表示出来的数k 则k与 a,b 互质这里有一个结论:(网上有证明)不过我是打表找的规律若 x,y(设x<y) 互质则 : ...
Ubuntu关机与重启的相关指令
将数据同步写入到磁盘中的指令:sync 惯用的关机指令:shutdown 重新启动,关机:reboot,halt,poweroff shutdown可完成如下工作: 1.可以自由选择关机模式:是要关机 ...
Selenium WebDriver- 操作JavaScript的confirm弹窗
#encoding=utf-8 import unittest import time from selenium import webdriver from selenium.webdriver i ...
[linux time命令学习篇] time 统计命令执行的时间
注意: 命令后面一定要有分号; http://codingstandards.iteye.com/blog/798788 用途说明 time命令常用于测量一个命令的运行时间,注意不是用来显示和修改系统 ...
[linux小技巧]批量移动文件
for i in {1..23};do mv test$i/ ../;done
Oracle 用户和权限
Oracle 用户和权限Oracle 中,一般不会轻易在一个服务器上创建多个数据库,在一个数据库中,不同的项目由不同的用户访问,每一个用户拥有自身创建的数据库对象,因此用户的概念在 Oracle中非常 ...
Spring 4.3.11.RELEASE文档阅读（二）：Core Technologies_IOC
在看这部分内容的时候,想了一些问题: 容器: 1,什么是容器用来包装或装载物品的贮存器 2,容器能做什么包装或装载物品 3,为什么需要容器为什么要使用集装箱?如果没有容器会是什么样? 4,常见的 ...
九度oj 题目1368：二叉树中和为某一值的路径
题目描述: 输入一颗二叉树和一个整数,打印出二叉树中结点值的和为输入整数的所有路径.路径定义为从树的根结点开始往下一直到叶结点所经过的结点形成一条路径. 输入: 每个测试案例包括n+1行: 第一行为2 ...

Deep learning with PyTorch: A 60 minute blitz _note(1) Tensors

Deep learning with PyTorch: A 60 minute blitz _note(1) Tensors的更多相关文章

随机推荐

热门专题