Pytorch-tensor的感知机,链式法则

1.单层感知机

单层感知机的主要步骤：

1.对数据进行一个权重的累加求和，求得∑
2.将∑经过一个激活函数Sigmoid，得出值O
3.再将O，经过一个损失函数mse_loss，得出值loss
4.根据loss，以及前边所求得的值，求得loss对各个w的偏导数
5.更新w值

    # 单层感知机梯度的推导

    # 要进行优化的是w，对w进行梯度下降

    a=torch.randn(1,10)

    # a是一个【1,10】的向量

    w=torch.randn(1,10,requires_grad=True)

    # w是一个可导的【1,10】的向量

    # 1.2.经过一个sigmoid激活函数

    o=torch.sigmoid(a@w.t())

    print(o.shape)

    # 3.经过一个mse_loss损失函数

    # loss是一个标量

    loss=F.mse_loss(torch.ones(1,1),o)

    print(loss.shape)

    # 4.求loss对w0，w1....w9的偏导数

    loss.backward()

    print(w.grad)

    # 5.后边就可以对w进行梯度更新

输出结果

torch.Size([1, 1])

torch.Size([])

tensor([[ 3.6432e-05, -7.3545e-05, -4.3179e-05,  3.3986e-04, -9.5312e-05,

         -1.7416e-04, -1.7869e-05, -2.3893e-04, -1.5513e-04, -2.1554e-05]])

多层感知机的主要步骤：

1.对数据进行一个权重的累加求和，求得∑1,∑2,,,∑m
2.将∑1,∑2,,,∑m经过一个激活函数Sigmoid，得出值O1,O2,,,Om
3.再将O1,O2,,,Om，经过一个损失函数mse_loss，得出值loss
4.根据loss，以及前边所求得的值，求得loss对各个w的偏导数
5.更新w值

    # 多层感知机梯度的推导

    # 要进行优化的是w，对w进行梯度下降

    a=torch.randn(1,10)

    # a是一个【1,10】的向量

    w=torch.randn(2,10,requires_grad=True)

    # w是一个可导的【2,10】的向量

    # 1.2.经过一个sigmoid激活函数

    o=torch.sigmoid(a@w.t())

    print(o.shape)

    # 3.经过一个mse_loss损失函数

    # loss是一个标量

    loss=F.mse_loss(torch.ones(1,2),o)

    print(loss)

    # 4.求loss对w0，w1....w9的偏导数

    loss.backward()

    print(w.grad)

    # 5.后边就可以对w进行梯度更新

输出结果

torch.Size([1, 2])

tensor(0.2823, grad_fn=<MeanBackward0>)

tensor([[-0.0654,  0.0242,  0.0045, -0.1007,  0.0259, -0.0522, -0.0327,  0.0805,-0.0180,-0.0186],

        [-0.1300,  0.0481,  0.0090, -0.2002,  0.0514, -0.1037, -0.0650,  0.1599,-0.0358,-0.0371]])

链式法则：

y=f(u),u=f(x),y对x的导数，可以通过u来中间传递，也就是说dy/dx=(dy/du)*(du/dx)

    x=torch.rand(1)

    w1=torch.rand(1,requires_grad=True)

    b1=torch.rand(1)

    w2=torch.rand(1,requires_grad=True)

    b2=torch.rand(1)

    y1=x*w1+b1

    y2=y1*w2+b2

    dy1_dw1=torch.autograd.grad(y1,[w1],retain_graph=True)[0]

    dy2_dy1=torch.autograd.grad(y2,[y1],retain_graph=True)[0]

    dy2_dw1=torch.autograd.grad(y2,[w1],retain_graph=True)[0]

    print(dy1_dw1*dy2_dy1)

    print(dy2_dw1)

输出结果

tensor([0.1867])

tensor([0.1867])

Pytorch-tensor的感知机,链式法则的更多相关文章

Pytorch Tensor 常用操作
https://pytorch.org/docs/stable/tensors.html dtype: tessor的数据类型,总共有8种数据类型,其中默认的类型是torch.FloatTensor, ...
Pytorch Tensor, Variable, 自动求导
2018.4.25,Facebook 推出了 PyTorch 0.4.0 版本,在该版本及之后的版本中,torch.autograd.Variable 和 torch.Tensor 同属一类.更确切地 ...
从头学pytorch(五) 多层感知机及其实现
多层感知机上图所示的多层感知机中,输入和输出个数分别为4和3,中间的隐藏层中包含了5个隐藏单元(hidden unit).由于输入层不涉及计算,图3.3中的多层感知机的层数为2.由图3.3可见,隐藏 ...
pytorch tensor与numpy转换
从官网拷贝过来的,就是做个学习记录.版本 0.4 tensor to numpy a = torch.ones(5) print(a) 输出 tensor([1., 1., 1., 1., 1.]) ...
pytorch tensor 维度理解.md
torch.randn torch.randn(*sizes, out=None) → Tensor(张量) 返回一个张量,包含了从标准正态分布(均值为0,方差为 1)中抽取一组随机数,形状由可变参数 ...
pytorch tensor的索引与切片
切片方式与numpy是类似. * a[:2, :1, :, :], * 可以用-1索引. * ::2,表示所有数据,间隔为2,即 start:end:step. * a.index_select(1 ...
Pytorch Tensor 维度的扩充和压缩
维度扩展 x.unsqueeze(n) 在 n 号位置添加一个维度例子: import torch x = torch.rand(3,2) x1 = x.unsqueeze(0) # 在第一维的位置 ...
【Code】numpy、pytorch实现全连接神经网络
""" 利用numpy实现一个两层的全连接网络网络结构是:input ->(w1) fc_h -> relu ->(w2) output 数据是随机出 ...
Pytorch 常用函数
1. torch.renorm(input, p, dim, maxnorm, out=None) → Tensor Returns a tensor where each sub-tensor of ...
神经网络架构PYTORCH－几个概念
使用Pytorch之前,有几个概念需要弄清楚．什么是Tensors(张量)? 这个概念刚出来的时候,物理科班出身的我都感觉有点愣住了,好久没有接触过物理学的概念了．这个概念,在物理学中怎么解释呢? ...

随机推荐

云计算 - 内容分发网络CDN技术与应用全解
在这篇全面解析CDN的技术文章中,我们深入探讨了CDN的基础概念.核心架构.多样化产品和在不同行业中的应用案例.文章揭示了CDN技术如何优化内容分发,提升用户体验,并展望了CDN面临的挑战和未来发展趋 ...
iptables五表五链及对应实例
iptables是Linux系统上用于配置网络包过滤规则的工具,它使用表(tables)和链(chains)来组织规则.以下是iptables中的五表五链及其对应的实例说明: 五表 filter表:默 ...
jsp转换成html
相信很多人都希望自己的页面越快越好,最好是能静态的,提高客户访问速度.也便于搜索引擎搜索.所以,就希望我们的动态读取数据库的页面,尽可能的生成静态页面.一下系列文章,介绍一下个人的解决方案. ...
低代码平台前端的设计与实现（二）构建引擎BuildEngine切面处理设计
上一篇文章,我们介绍了如何设计并实现一个轻量级的根据JSON的渲染引擎,通过快速配置一份规范的JSON文本内容,就可以利用该JSON生成一个基础的UI界面.本文我们将回到低开的核心-页面拖拉拽,探讨关 ...
记录--记录用前端代替后端生成zip的过程，速度快了 57 倍！！！
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助业务场景: 产品有个功能是设置主题.类似手机自动切换壁纸,以及其他功能颜色,icon,字体等. 管理员需要在后端管理系统多次下载不同主题, ...
【Jenkins】Jenkins 运行权限问题
yum安装的Jenkins 配置文件默认位置/etc/sysconfig/jenkins 默认jenkins服务以jenkins用户运行,这时在jenkins执行maven脚本时可能会发生没有权限操作 ...
mysql统计所有分类下的数量，没有的也要展示
要求统计所有分类下的数量,如果分类下没有对应的数据也要展示.这种问题在日常的开发中很常见,每次写每次忘,所以在此记录下. 这种统计往往不能直接group by,因为有些类别可能没有对应的数据这里有两 ...
DynamicHead：基于像素级路由机制的动态FPN | NIPS 2020
论文提出了细粒度动态detection head,能够基于路由机制动态地融合不同FPN层的像素级局部特征进行更好的特征表达.从设计的路由空间来看是一个十分耗时的操作,但是作者设计的高效路由器实际计算十 ...
UE4蓝图对Actor的引用
通过关卡蓝图调用在关卡中放置一个Actor,在关卡蓝图中右键 create a reference to actor,即可注意使用该方法创建时,需要现在关卡中选择上该类Actor 当Actor生成 ...
spark和hadoop的区别
hadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构. 用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力进行高速运算和存储. Hadoop实现了一个分 ...

Pytorch-tensor的感知机,链式法则

1.单层感知机

单层感知机的主要步骤：

多层感知机的主要步骤：

链式法则：

Pytorch-tensor的感知机,链式法则的更多相关文章

随机推荐

热门专题