小白学习之pytorch框架(3)-模型训练三要素+torch.nn.Linear()

　模型训练的三要素：数据处理、损失函数、优化算法　

数据处理(模块torch.utils.data)

从线性回归的的简洁实现-初始化模型参数(模块torch.nn.init)开始

from torch.nn import init   # pytorch的init模块提供了多中参数初始化方法

init.normal_(net[0].weight, mean=0, std=0.01)    #初始化net[0].weight的期望为0，标准差为0.01的正态分布tensor

init.constant_(net[0].bias, val=0)  #初始化net[0].bias，值为0的常数tensor
# 此外还封装了好多
# init.ones_(w) 初始化一个形状如w的全1分布的tensor,如w是3行5列，则初始化为3行5列的全1tensor
# init.zeros_(w) 初始化一个形状如w的全0分布的tensor
# init.eye_(w) 初始化一个形状如w的对角线为1，其余为0的tensor
# init.sparse_(w,sparsity=0.1) 初始化一个形状如w稀疏性为0.1的稀疏矩阵

　损失函数(模块torch.nn含有大量的神经网络层)

　pytorch的nn模块中定义了各种损失函数，这些损失函数可以看成一种特殊的网络层　

loss = nn.MSELoss()  # 均方误差损失函数
# torch.nn.MSELoss(reduce=True, size_average=True)
# reduce=True,返回标量形式的loss,reduce=False，返回向量形式的loss
# size_average=True,返回loss.mean(),size_average=False,返回loss.sum()
# 默认两者皆为True

　优化算法(模块torch.optim)

torch.optim模块定义了很多的优化算法，如SGD、Adam、RMSProp等

import torch.optim as optim

optimizer = optim.SGD(net.parameters(), lr=0.03)

print(optimizer)

# 对不同的子网络设置不同的学习率
optimizer = optim.SGD([
　　　　　　　　　　# 如果对某个参数不指定学习率，就使用最外层的默认学习率
　　　　　　　　　　{'params':net.subnet1.parameters()}, # lr=0.03
　　　　　　　　　　{'params':net.subnet2.parameters(),'lr':0.01}
],lr=0.03)

　　设置动态学习率，不是固定一个常数

　　方法1、修改optimizer.param_groups中的学习率

#调整学习率

for param_group in optimizer.param_groups:

    param_group['lr'] *= 0.1   # 学习率是之前的0.1倍

　　方法2、新建优化器，即构建新的optimizer。使用动量的优化器(如Adam)，可能会丢失动量等状态信息，可能会造成损失函数的收敛出现震荡等情况。

optimizer = optim.SGD([

                {'param':net.subnet1.parameters()},

                {'param':net.subnet2.parameters(),'lr':old_lr*0.1}],lr=0.03)

　　上述代码若不理解net.subnet1.parameters()，可参考博客 https://www.cnblogs.com/hellcat/p/8496727.html 万分感谢博主

view(-1,1) # -1是不确定几行的意思，在这就是我不确定要取几行，但是肯定是一列，故view(-1,1)；

　　torch.view()和numpy.reshape()效果一样，view操作的是tensor，且view后的tensor和原tensor共享内存，修改其中一个，另一个也会改变，reshape()操作的是nparray。

　　线性回归　　

　　torch.nn.Linear(in_features,out_features,bias)

　　参数解析：

　　　　in_features：输入特征的数量(或称为特征数或特征向量X的维度)，即在房价预测中仅和房龄与面积有关，则in_features=2

　　　　out_features：输出特征的数量(同in_features)

　　　　bias：偏置，默认为True

　　例子请参考 https://www.cnblogs.com/Archer-Fang/p/10645473.html 感谢博主

小白学习之pytorch框架(3)-模型训练三要素+torch.nn.Linear()的更多相关文章

小白学习之pytorch框架(6)-模型选择(K折交叉验证)、欠拟合、过拟合(权重衰减法(=L2范数正则化)、丢弃法)、正向传播、反向传播
下面要说的基本都是<动手学深度学习>这本花书上的内容,图也采用的书上的首先说的是训练误差(模型在训练数据集上表现出的误差)和泛化误差(模型在任意一个测试数据集样本上表现出的误差的期望) ...
小白学习之pytorch框架(2)-动手学深度学习(begin-random.shuffle()、torch.index_select()、nn.Module、nn.Sequential())
在这向大家推荐一本书-花书-动手学深度学习pytorch版,原书用的深度学习框架是MXNet,这个框架经过Gluon重新再封装,使用风格非常接近pytorch,但是由于pytorch越来越火,个人又比 ...
小白学习之pytorch框架(1)-torch.nn.Module+squeeze(unsqueeze)
我学习pytorch框架不是从框架开始,从代码中看不懂的pytorch代码开始的可能由于是小白的原因,个人不喜欢一些一下子粘贴老多行代码的博主或者一些弄了一堆概念,导致我更迷惑还增加了畏惧的情绪(个 ...
小白学习之pytorch框架(7)之实战Kaggle比赛：房价预测(K折交叉验证、*args、**kwargs)
本篇博客代码来自于<动手学深度学习>pytorch版,也是代码较多,解释较少的一篇.不过好多方法在我以前的博客都有提,所以这次没提.还有一个原因是,这篇博客的代码,只要好好看看肯定能看懂( ...
小白学习之pytorch框架(4)-softmax回归(torch.gather()、torch.argmax()、torch.nn.CrossEntropyLoss())
学习pytorch路程之动手学深度学习-3.4-3.7 置信度.置信区间参考:https://cloud.tencent.com/developer/news/452418 本人感觉还是挺好理解的交 ...
小白学习之pytorch框架(5)-多层感知机(MLP)-(tensor、variable、计算图、ReLU()、sigmoid()、tanh())
先记录一下一开始学习torch时未曾记录(也未好好弄懂哈)导致又忘记了的tensor.variable.计算图计算图计算图直白的来说,就是数学公式(也叫模型)用图表示,这个图即计算图.借用 htt ...
全面解析Pytorch框架下模型存储，加载以及冻结
最近在做试验中遇到了一些深度网络模型加载以及存储的问题,因此整理了一份比较全面的在 PyTorch 框架下有关模型的问题.首先咱们先定义一个网络来进行后续的分析: 1.本文通用的网络模型 import ...
Pytorch修改ResNet模型全连接层进行直接训练
之前在用预训练的ResNet的模型进行迁移训练时,是固定除最后一层的前面层权重,然后把全连接层输出改为自己需要的数目,进行最后一层的训练,那么现在假如想要只是把最后一层的输出改一下,不需要加载前面层 ...
深度学习之PyTorch实战（3）——实战手写数字识别
上一节,我们已经学会了基于PyTorch深度学习框架高效,快捷的搭建一个神经网络,并对模型进行训练和对参数进行优化的方法,接下来让我们牛刀小试,基于PyTorch框架使用神经网络来解决一个关于手写数字 ...

随机推荐

TypeScript 文件引入 Html （ts import html webpack）
我们的目标是把html引入ts文件,webpack打包时就能把html打进js文件,减少文件加载啦 1 安装 text-loader npm install text-loader --save-de ...
java项目提交到码云
1.在码云上面创建一个新的项目,用于存放提交的项目内容 2.在需要共享的项目上右键-->team-->Share Project分享项目-->勾选 Use or create rep ...
集合框架的详解，List（ArrayList,LinkedList,Vector）,Set(HashSet,TreeSet)-(14)
集合详解: /* Collection |--List:元素是有序的,元素可以重复.因为该集合体系有索引. |--ArrayList:底层的数据结构使用的是数组结构.特点:查询速度很快.但是增删稍慢. ...
SFINAE 与 type_traits
SFINAE 与 type_traits SFINAE 替换失败不是错误 (Substitution Failure Is Not An Error),此特性被用于模板元编程. 在函数模板的重载决议中 ...
maven的理解和使用
一.maven是什么? maven是项目管理工具二.maven为什么要用? 在做开发的时候常常会用到外部的工具包(jar包),这就需要你一个一个的去他们的官网下工具包,然后在项目里依赖他们,比较的麻 ...
标准库模块——json模块
将Python数据类型转换为其他代码格式叫做(序列化),而json就是在各个代码实现转换的中间件. 序列化要求: 1. 只能有int,str,bool,list,dict,tuple的类型支持序列化. ...
VS.NET中的常用控件和类型的命名规范
表1 命名规范 VS名称简写 VS名称简写数据类型 Array arr Boolean bln Byte byt Char Chr Date Time dtm Decimal dtm Doub ...
shell教程<入门篇>
由于我平时的工作环境是linux,所以无可避免的经常使用命令行模式和shell脚本,而且有些命令行每天都要输好多遍,比如ssh登录之类的,所以干脆把平时常用的命令都写成脚本文件,所以特意开了一个she ...
POJ 3258：River Hopscotch 二分的好想法
River Hopscotch Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 9326 Accepted: 4016 D ...
zabbix监控日志关键字
1 添加zabbix监控项目 A.选择类型为“”zabbix客户端(主动式)“” B.键值: xx_log.log 为日志的绝对路径 connectException 为关键字 ---需根据自己需要定 ...

小白学习之pytorch框架(3)-模型训练三要素+torch.nn.Linear()

小白学习之pytorch框架(3)-模型训练三要素+torch.nn.Linear()的更多相关文章

随机推荐

热门专题