Pytorch-tensor的感知机,链式法则

1.单层感知机

单层感知机的主要步骤：

1.对数据进行一个权重的累加求和，求得∑
2.将∑经过一个激活函数Sigmoid，得出值O
3.再将O，经过一个损失函数mse_loss，得出值loss
4.根据loss，以及前边所求得的值，求得loss对各个w的偏导数
5.更新w值

    # 单层感知机梯度的推导

    # 要进行优化的是w，对w进行梯度下降

    a=torch.randn(1,10)

    # a是一个【1,10】的向量

    w=torch.randn(1,10,requires_grad=True)

    # w是一个可导的【1,10】的向量

    # 1.2.经过一个sigmoid激活函数

    o=torch.sigmoid(a@w.t())

    print(o.shape)

    # 3.经过一个mse_loss损失函数

    # loss是一个标量

    loss=F.mse_loss(torch.ones(1,1),o)

    print(loss.shape)

    # 4.求loss对w0，w1....w9的偏导数

    loss.backward()

    print(w.grad)

    # 5.后边就可以对w进行梯度更新

输出结果

torch.Size([1, 1])

torch.Size([])

tensor([[ 3.6432e-05, -7.3545e-05, -4.3179e-05,  3.3986e-04, -9.5312e-05,

         -1.7416e-04, -1.7869e-05, -2.3893e-04, -1.5513e-04, -2.1554e-05]])

多层感知机的主要步骤：

1.对数据进行一个权重的累加求和，求得∑1,∑2,,,∑m
2.将∑1,∑2,,,∑m经过一个激活函数Sigmoid，得出值O1,O2,,,Om
3.再将O1,O2,,,Om，经过一个损失函数mse_loss，得出值loss
4.根据loss，以及前边所求得的值，求得loss对各个w的偏导数
5.更新w值

    # 多层感知机梯度的推导

    # 要进行优化的是w，对w进行梯度下降

    a=torch.randn(1,10)

    # a是一个【1,10】的向量

    w=torch.randn(2,10,requires_grad=True)

    # w是一个可导的【2,10】的向量

    # 1.2.经过一个sigmoid激活函数

    o=torch.sigmoid(a@w.t())

    print(o.shape)

    # 3.经过一个mse_loss损失函数

    # loss是一个标量

    loss=F.mse_loss(torch.ones(1,2),o)

    print(loss)

    # 4.求loss对w0，w1....w9的偏导数

    loss.backward()

    print(w.grad)

    # 5.后边就可以对w进行梯度更新

输出结果

torch.Size([1, 2])

tensor(0.2823, grad_fn=<MeanBackward0>)

tensor([[-0.0654,  0.0242,  0.0045, -0.1007,  0.0259, -0.0522, -0.0327,  0.0805,-0.0180,-0.0186],

        [-0.1300,  0.0481,  0.0090, -0.2002,  0.0514, -0.1037, -0.0650,  0.1599,-0.0358,-0.0371]])

链式法则：

y=f(u),u=f(x),y对x的导数，可以通过u来中间传递，也就是说dy/dx=(dy/du)*(du/dx)

    x=torch.rand(1)

    w1=torch.rand(1,requires_grad=True)

    b1=torch.rand(1)

    w2=torch.rand(1,requires_grad=True)

    b2=torch.rand(1)

    y1=x*w1+b1

    y2=y1*w2+b2

    dy1_dw1=torch.autograd.grad(y1,[w1],retain_graph=True)[0]

    dy2_dy1=torch.autograd.grad(y2,[y1],retain_graph=True)[0]

    dy2_dw1=torch.autograd.grad(y2,[w1],retain_graph=True)[0]

    print(dy1_dw1*dy2_dy1)

    print(dy2_dw1)

输出结果

tensor([0.1867])

tensor([0.1867])

Pytorch-tensor的感知机,链式法则的更多相关文章

Pytorch Tensor 常用操作
https://pytorch.org/docs/stable/tensors.html dtype: tessor的数据类型,总共有8种数据类型,其中默认的类型是torch.FloatTensor, ...
Pytorch Tensor, Variable, 自动求导
2018.4.25,Facebook 推出了 PyTorch 0.4.0 版本,在该版本及之后的版本中,torch.autograd.Variable 和 torch.Tensor 同属一类.更确切地 ...
从头学pytorch(五) 多层感知机及其实现
多层感知机上图所示的多层感知机中,输入和输出个数分别为4和3,中间的隐藏层中包含了5个隐藏单元(hidden unit).由于输入层不涉及计算,图3.3中的多层感知机的层数为2.由图3.3可见,隐藏 ...
pytorch tensor与numpy转换
从官网拷贝过来的,就是做个学习记录.版本 0.4 tensor to numpy a = torch.ones(5) print(a) 输出 tensor([1., 1., 1., 1., 1.]) ...
pytorch tensor 维度理解.md
torch.randn torch.randn(*sizes, out=None) → Tensor(张量) 返回一个张量,包含了从标准正态分布(均值为0,方差为 1)中抽取一组随机数,形状由可变参数 ...
pytorch tensor的索引与切片
切片方式与numpy是类似. * a[:2, :1, :, :], * 可以用-1索引. * ::2,表示所有数据,间隔为2,即 start:end:step. * a.index_select(1 ...
Pytorch Tensor 维度的扩充和压缩
维度扩展 x.unsqueeze(n) 在 n 号位置添加一个维度例子: import torch x = torch.rand(3,2) x1 = x.unsqueeze(0) # 在第一维的位置 ...
【Code】numpy、pytorch实现全连接神经网络
""" 利用numpy实现一个两层的全连接网络网络结构是:input ->(w1) fc_h -> relu ->(w2) output 数据是随机出 ...
Pytorch 常用函数
1. torch.renorm(input, p, dim, maxnorm, out=None) → Tensor Returns a tensor where each sub-tensor of ...
神经网络架构PYTORCH－几个概念
使用Pytorch之前,有几个概念需要弄清楚．什么是Tensors(张量)? 这个概念刚出来的时候,物理科班出身的我都感觉有点愣住了,好久没有接触过物理学的概念了．这个概念,在物理学中怎么解释呢? ...

随机推荐

魅族16T屏幕尺子
WEBRTC回声消除-AECM算法源码解析之参数解析
一概述 webrtc 针对回声问题一共开源了3种回声消除算法,分别为aec,aecm,以及aec3,其中aec是最早期的版本,在后续的更新中aec3的出现代替了aec在webrtc 中的地位,而 ...
Handler屏障消息
Handler 屏障消息 Handler Message 种类 Handler的Message种类分为3种: 普通消息屏障消息异步消息同步消息我们默认用的都是同步消息,即前面讲Handler里 ...
Java浮点数内存存储
转自: [解惑]剖析float型的内存存储和精度丢失问题 1.小数的二进制表示问题首先我们要搞清楚下面两个问题: (1) 十进制整数如何转化为二进制数算法很简单.举个例子,11表示成二进制数: ...
记录-JavaScript常规加密技术
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助当今Web开发中,数据安全是一个至关重要的问题,为了确保数据的安全性,我们需要使用加密技术.JavaScript作为一种客户端编程语言,可 ...
C# OpenCvSharp 轮廓检测
效果代码 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data ...
KingbaseES V8R6在解决复制冲突中hot_standby_feedback参数的重要性
背景如果我们看到这样的类似报错:那说明可能遇到了复制冲突. 复制冲突的理解:当备库正在应用主库传输过来的wal日志与备库正在进行的查询产生冲突就会有此报错.比如说备库正在执行基于某个表的查询,这时主 ...
基于rk3588----i2c驱动框架学习（2）-总线驱动 algorithm 分析
rk3588 i2c algorithm 分析来了来了,上次分析完i2c的驱动框架今天我们就看看i2c的algorithm是如何实现的 static const struct i2c_algori ...
windows系统命令行cmd查看显卡驱动版本号CUDA
Win+R 输入cmd 进入命令行输入 nvidia-smi
【Java面试题】SpringMVC
九.SpringMVC 63)SpringMVC 的流程 a.用户向服务器发送请求,请求被 SpringMVC 前端控制器 DispatchServlet 捕获: b.DispatcherServle ...

Pytorch-tensor的感知机,链式法则

1.单层感知机

单层感知机的主要步骤：

多层感知机的主要步骤：

链式法则：

Pytorch-tensor的感知机,链式法则的更多相关文章

随机推荐

热门专题