TensoFlow自动求导机制

『TensorFlow』第二弹_线性拟合&神经网络拟合_恰是故人归

下面做了三个简单尝试,

  • 利用包含gradients、assign等tf函数直接构建图进行自动梯度下降
  • 利用优化器计算出导数,再将导数应用到变量上
  • 直接使用优化器不显式得到导数

更新参数必须使用assign,这也可能会涉及到控制依赖问题。

# Author : Hellcat
# Time : 2/20/2018 import tensorflow as tf tf.set_random_seed(1000) def get_fake_data(batch_size=8):
x = 20 * tf.random_uniform([batch_size,1],dtype=tf.float32)
y = tf.multiply(x,3) + 1 + tf.multiply(
tf.random_normal([batch_size,1],mean=0,stddev=0.01,dtype=tf.float32),1)
return x, y x, y = get_fake_data() w = tf.Variable(tf.random_uniform([1,1], dtype=tf.float32), name='w')
b = tf.Variable(tf.random_uniform([1,1], dtype=tf.float32), name='b') lr = 0.001 y_pred = tf.add(tf.multiply(w,x),b)
loss = tf.reduce_mean(tf.pow(tf.multiply(0.5,(y_pred - y)),2),axis=0) # 梯度尝试
grad_w, grad_b = tf.gradients(loss,[w,b])
train_w = tf.assign(w,tf.subtract(w,lr*grad_w))
train_b = tf.assign(b,tf.subtract(b,lr*grad_b))
train = [train_w, train_b] # 使用优化器
# optimizer = tf.train.GradientDescentOptimizer(lr) # 优化器&学习率选择
# ## 优化器+梯度操作
# grads_and_vars = optimizer.compute_gradients(loss, [w,b])
# train = optimizer.apply_gradients(grads_and_vars)
## 优化器径直优化
# train = optimizer.minimize(loss) with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
for ii in range(80000):
sess.run([train])
if ii % 1000 == 0:
print(sess.run(w),sess.run(b))

PyTorch自动求导机制

由于梯度是会累加的,所以清空梯度一定不要忘记。

import torch as t
from torch.autograd import Variable as V
import matplotlib.pyplot as plt
from IPython import display # 指定随机数种子
t.manual_seed(1000) def get_fake_data(batch_size=8):
x = t.rand(batch_size,1)*20
y = x * 2 + 3 + 3*t.randn(batch_size,1)
return x, y x, y = get_fake_data()
plt.scatter(x.squeeze(), y.squeeze()) w = V(t.rand(1,1),requires_grad=True)
b = V(t.rand(1,1),requires_grad=True) lr = 0.001 for ii in range(8000):
x, y = get_fake_data()
x, y = V(x), V(y)
# print(x, y)
y_pred = x.mm(w) + b.expand_as(x) loss = 0.5*(y_pred - y)**2
loss = loss.sum() # 集结loss向量 loss.backward() w.data.sub_(lr * w.grad.data)
b.data.sub_(lr * b.grad.data) w.grad.data.zero_()
b.grad.data.zero_() if ii % 1000 == 0:
display.clear_output(wait=True)
x = t.arange(0,20).view(-1,1)
y = x.mm(w.data) + b.data.expand_as(x)
plt.plot(x.numpy(), y.numpy())
x2, y2 = get_fake_data(batch_size=20)
plt.scatter(x2, y2) plt.xlim(0,20)
plt.ylim(0,40)
plt.show() print(w.data.squeeze(), b.data.squeeze())

『PyTorch x TensorFlow』第六弹_从最小二乘法看自动求导的更多相关文章

  1. 『PyTorch x TensorFlow』第八弹_基本nn.Module层函数

    『TensorFlow』网络操作API_上 『TensorFlow』网络操作API_中 『TensorFlow』网络操作API_下 之前也说过,tf 和 t 的层本质区别就是 tf 的是层函数,调用即 ...

  2. 『TensorFlow』第七弹_保存&载入会话_霸王回马

    首更: 由于TensorFlow的奇怪形式,所以载入保存的是sess,把会话中当前激活的变量保存下来,所以必须保证(其他网络也要求这个)保存网络和载入网络的结构一致,且变量名称必须一致,这是caffe ...

  3. [深度学习] pytorch学习笔记(1)(数据类型、基础使用、自动求导、矩阵操作、维度变换、广播、拼接拆分、基本运算、范数、argmax、矩阵比较、where、gather)

    一.Pytorch安装 安装cuda和cudnn,例如cuda10,cudnn7.5 官网下载torch:https://pytorch.org/ 选择下载相应版本的torch 和torchvisio ...

  4. 『TensorFlow』第十一弹_队列&多线程&TFRecod文件_我辈当高歌

    TF数据读取队列机制详解 一.TFR文件多线程队列读写操作 TFRecod文件写入操作 import tensorflow as tf def _int64_feature(value): # val ...

  5. 『TensorFlow』第十弹_队列&多线程_道路多坎坷

    一.基本队列: 队列有两个基本操作,对应在tf中就是enqueue&dequeue tf.FIFOQueue(2,'int32') import tensorflow as tf '''FIF ...

  6. 『TensorFlow』第三弹_可视化框架介绍_悄悄问圣僧

    添加记录节点 -> 汇总记录节点 -> run汇总节点 -> [书写器生成]书写入文件 [-> 刷新缓冲区] 可视化关键点: 注意, 1.with tf.name_scope( ...

  7. 『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下

    『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...

  8. 『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上

    总结一下相关概念: torch.Tensor - 一个近似多维数组的数据结构 autograd.Variable - 改变Tensor并且记录下来操作的历史记录.和Tensor拥有相同的API,以及b ...

  9. pytorch的自动求导机制 - 计算图的建立

    一.计算图简介 在pytorch的官网上,可以看到一个简单的计算图示意图, 如下. import torchfrom torch.autograd import Variable x = Variab ...

随机推荐

  1. 我对于B-树索引的内部结构与索引类型所做的笔记

    图 3-1 B-树索引的内部结构 分支块和页块 B-树索引有两种类型的块: 用于查找的分支块和用于存储值的叶块.B-树索引的上层分支块包含指向下层索引块的索引数据.在图 3-1 中,根分支块包含条目 ...

  2. RabbitMQ的消息确认机制

    一:确认种类 RabbitMQ的消息确认有两种. 一种是消息发送确认.这种是用来确认生产者将消息发送给交换器,交换器传递给队列的过程中,消息是否成功投递.发送确认分为两步,一是确认是否到达交换器,二是 ...

  3. 关于${pageContext.request.contextPath}的理解 (转载)

    ${pageContext.request.contextPath}是JSP取得绝对路径的方法,等价于<%=request.getContextPath()%> . 也就是取出部署的应用程 ...

  4. Monte Carlo simulated annealing

    蒙特·卡罗分子模拟计算 使用蒙特·卡罗方法进行分子模拟计算是按照以下步骤进行的: 1. 使用随机数发生器产生一个随机的分子构型. 2. 对此分子构型的其中粒子坐标做无规则的改变,产生一个新的分子构型. ...

  5. 57.搭建Vue环境

    nodejs官网http://nodejs.cn/下载安装包,无特殊要求可本地傻瓜式安装,这里选择2017-5-2发布的 v6.10.3 cmd命令行: node -v //显示node版本 v6.1 ...

  6. 从Win32程序中的主函数中获取命令行参数

    在标准C或者Win32控制台程序的main函数中,它们都有两个参数:"argc" 和 "argv",如下所示: int main(int argc, char ...

  7. Qt 半模式对话框

    今天看视频,学习好半模式对话框,好新奇哟,这里记录下来. 半模式对话框,介于模式对话框和飞模式对话框之间.半模式对话框会像模式对话框一样阻塞主界面的事件响应,同时,半模式对话框会像非模态对话框一样,立 ...

  8. Oracle数据库基础入门《一》Oracle服务器的构成

    Oracle数据库基础入门<一>Oracle服务器的构成 Oracle 服务器是一个具有高性能和高可靠性面向对象关系型数据库管理系统,也是一 个高效的 SQL 语句执行环境. Oracle ...

  9. 使用dbeaver查mysql的表会导致锁表的问题

    查询完成之后接着需要使用rollback,不然其它session没法执行语句.

  10. 2017.11.18 手把手教你学51单片机-点亮LED

    In Doing We Learning 在操作中学习.如果只是光看教程,没有实际的操作,对编程语言的理解很空泛,所以决定从单片机中学习C语言. #include<reg52.h>     ...