这篇博客来自csdn，完全用于学习。

Introduce

在pytorch中，torch.nn.Module模块中的state_dict变量存放训练过程中需要学习的权重和偏执系数，state_dict作为python的字典对象将每一层的参数映射成tensor张量，需要注意的是torch.nn.Module模块中的state_dict只包含卷积层和全连接层的参数，当网络中存在batchnorm时，例如vgg网络结构，torch.nn.Module模块中的state_dict也会存放batchnorm's running_mean，关于batchnorm详解可见https://blog.csdn.net/wzy_zju/article/details/81262453

torch.optim模块中的Optimizer优化器对象也存在一个state_dict对象，此处的state_dict字典对象包含state和param_groups的字典对象，而param_groups key对应的value也是一个由学习率，动量等参数组成的一个字典对象。

因为state_dict本质上Python字典对象，所以可以很好地进行保存、更新、修改和恢复操作（python字典结构的特性），从而为PyTorch模型和优化器增加了大量的模块化。

Sample

通过一个简单的案例来输出state_dict字典对象中存放的变量

#encoding:utf-8

import torch

import torch.nn as nn

import torch.optim as optim

import torchvision

import numpy as mp

import matplotlib.pyplot as plt

import torch.nn.functional as F

#define model

class TheModelClass(nn.Module):

    def __init__(self):

        super(TheModelClass,self).__init__()

        self.conv1=nn.Conv2d(3,6,5)

        self.pool=nn.MaxPool2d(2,2)

        self.conv2=nn.Conv2d(6,16,5)

        self.fc1=nn.Linear(16*5*5,120)

        self.fc2=nn.Linear(120,84)

        self.fc3=nn.Linear(84,10)

    def forward(self,x):

        x=self.pool(F.relu(self.conv1(x)))

        x=self.pool(F.relu(self.conv2(x)))

        x=x.view(-1,16*5*5)

        x=F.relu(self.fc1(x))

        x=F.relu(self.fc2(x))

        x=self.fc3(x)

        return x

def main():

    # Initialize model

    model = TheModelClass()

    #Initialize optimizer

    optimizer=optim.SGD(model.parameters(),lr=0.001,momentum=0.9)

    #print model's state_dict

    print('Model.state_dict:')

    for param_tensor in model.state_dict():

        #打印 key value字典

        print(param_tensor,'\t',model.state_dict()[param_tensor].size())

    #print optimizer's state_dict

    print('Optimizer,s state_dict:')

    for var_name in optimizer.state_dict():

        print(var_name,'\t',optimizer.state_dict()[var_name])

if __name__=='__main__':

    main()

output：

Model.state_dict:

conv1.weight      torch.Size([6, 3, 5, 5])

conv1.bias      torch.Size([6])

conv2.weight      torch.Size([16, 6, 5, 5])

conv2.bias      torch.Size([16])

fc1.weight      torch.Size([120, 400])

fc1.bias      torch.Size([120])

fc2.weight      torch.Size([84, 120])

fc2.bias      torch.Size([84])

fc3.weight      torch.Size([10, 84])

fc3.bias      torch.Size([10])

Optimizer,s state_dict:

state      {}

param_groups      [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'params': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}]

csdn

CSDN

csdn

CSDN

【PyTorch】state_dict详解的更多相关文章

Pytorch框架详解之一
Pytorch基础操作 numpy基础操作定义数组(一维与多维) 寻找最大值维度上升与维度下降数组计算矩阵reshape 矩阵维度转换代码实现 import numpy as np a = ...
目标检测之Faster-RCNN的pytorch代码详解(数据预处理篇)
首先贴上代码原作者的github:https://github.com/chenyuntc/simple-faster-rcnn-pytorch(非代码作者,博文只解释代码) 今天看完了simple- ...
目标检测之Faster-RCNN的pytorch代码详解(模型训练篇)
本文所用代码gayhub的地址:https://github.com/chenyuntc/simple-faster-rcnn-pytorch (非本人所写,博文只是解释代码) 好长时间没有发博客了 ...
Pytorch Sampler详解
关于为什么要用Sampler可以阅读一文弄懂Pytorch的DataLoader, DataSet, Sampler之间的关系. 本文我们会从源代码的角度了解Sampler. Sampler 首先需要 ...
目标检测之Faster-RCNN的pytorch代码详解(模型准备篇)
十月一的假期转眼就结束了,这个假期带女朋友到处玩了玩,虽然经济仿佛要陷入危机,不过没关系,要是吃不上饭就看书,吃精神粮食也不错,哈哈!开个玩笑,是要收收心好好干活了,继续写Faster-RCNN的代码 ...
Pytorch autograd,backward详解
平常都是无脑使用backward,每次看到别人的代码里使用诸如autograd.grad这种方法的时候就有点抵触,今天花了点时间了解了一下原理,写下笔记以供以后参考.以下笔记基于Pytorch1.0 ...
pytorch之nn.Conv1d详解
转自:https://blog.csdn.net/sunny_xsc1994/article/details/82969867,感谢分享 pytorch之nn.Conv1d详解
[转载]Pytorch详解NLLLoss和CrossEntropyLoss
[转载]Pytorch详解NLLLoss和CrossEntropyLoss 来源:https://blog.csdn.net/qq_22210253/article/details/85229988 ...
【小白学PyTorch】11 MobileNet详解及PyTorch实现
文章来自微信公众号[机器学习炼丹术].我是炼丹兄,欢迎加我微信好友交流学习:cyx645016617. @ 目录 1 背景 2 深度可分离卷积 2.2 一般卷积计算量 2.2 深度可分离卷积计算量 2 ...
【小白学PyTorch】21 Keras的API详解（上）卷积、激活、初始化、正则
[新闻]:机器学习炼丹术的粉丝的人工智能交流群已经建立,目前有目标检测.医学图像.时间序列等多个目标为技术学习的分群和水群唠嗑答疑解惑的总群,欢迎大家加炼丹兄为好友,加入炼丹协会.微信:cyx6450 ...

随机推荐

docker 概念，安装，启动，运行
docker概念,安装,启动,运行模式 docker的概念镜像(image) 模板,可以通过模板来创建容器服务,tomcat镜像===>run==>tomacat01容器(提供服务),通 ...
RPC和 HTTP协议
RPC 和HTTP 的区别服务发现 HTTP,知道服务域名,可以通过 DNS 解析得到服务的IP地址,从而进行访问 RPC 需要一个专门的中间服务去保存服务名和IP信息(注册中心,nacos.c ...
【RabbitMQ】05 通配符模式
需要设定交换机模式为通配符模式 Topic 在绑定规则上采用通配描述实现动态绑定创建通配符模式的生产者 package cn.dzz.topicQueue; import com.rabbitmq. ...
公开号CN117354339A —— 数据传输专利 —— 解决了相关技术在进行数据传输的过程中时效性较差的技术问题
看到一个新闻: 地址: https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_92907119 ...
编程语言mojo报错：error: cannot call function that may raise in a context that cannot raise
代码: from python import Python fn main(): # fn main() raises: # This is equivalent to Python's `impor ...
git在idea中的冲突解决（非常重要)
1.什么是冲突冲突是指当你在提交或者更新代码时被合并的文件与当前文件不一致.读起来有点绕,结合下面的案例理解. 从上面对冲突的定义来看,冲突时发生在同一个文件上的. 2.生产上冲突的场景常见冲突的 ...
如何判断数据库和对象存储是否被 JuiceFS 使用？
随着使用 JuiceFS 的时间越来越长,一些用户已经用多种数据库和对象存储创建了很多的 JuiceFS 文件系统.有些是纯云端的,有些是纯本地的,有些则是本地与云端结合的.它们当中有一些是存储了文件 ...
寻访中国100家.NET中大企业 —— 第二站：苏州行
一:事情起因在.NET圈里混了十多年,相信有不少人知道我专注于玩 .NET高级调试,如今技术上的硬实力还是能够解决市面上的一些疑难杂症,但软实力却在另一个极端,如(人际交往,人情事故),所以就萌生了 ...
Blazor开发框架Known-V2.0.9
V2.0.9 Known是基于Blazor的企业级快速开发框架,低代码,跨平台,开箱即用,一处代码,多处运行.本次版本主要是修复一些BUG和表格页面功能增强. 官网:http://known.puma ...
C++20新特性
C++20新特性语言特性协程 concept概念指定初始化器 lambda表达式模板语义范围for循环增加初始化器 [[likely]] [unlikely]属性废弃隐式捕获this 非类型 ...

【PyTorch】state_dict详解

这篇博客来自csdn，完全用于学习。

Introduce

Sample

【PyTorch】state_dict详解的更多相关文章

随机推荐

热门专题