[Pytorch]Pytorch 保存模型与加载模型(转)

转自：知乎

保存模型与加载模型
冻结一部分参数，训练另一部分参数
采用不同的学习率进行训练

1.保存模型与加载

简单的保存与加载方法：

# 保存整个网络

torch.save(net, PATH)

# 保存网络中的参数, 速度快，占空间少

torch.save(net.state_dict(),PATH)

#--------------------------------------------------

#针对上面一般的保存方法，加载的方法分别是：

model_dict=torch.load(PATH)

model_dict=model.load_state_dict(torch.load(PATH))

然而，在实验中往往需要保存更多的信息，比如优化器的参数，那么可以采取下面的方法保存：

torch.save({'epoch': epochID + 1, 'state_dict': model.state_dict(), 'best_loss': lossMIN,

                            'optimizer': optimizer.state_dict(),'alpha': loss.alpha, 'gamma': loss.gamma},

                           checkpoint_path + '/m-' + launchTimestamp + '-' + str("%.4f" % lossMIN) + '.pth.tar')

以上包含的信息有，epochID, state_dict, min loss, optimizer, 自定义损失函数的两个参数；格式以字典的格式存储。

加载的方式：

def load_checkpoint(model, checkpoint_PATH, optimizer):

    if checkpoint != None:

        model_CKPT = torch.load(checkpoint_PATH)

        model.load_state_dict(model_CKPT['state_dict'])

        print('loading checkpoint!')

        optimizer.load_state_dict(model_CKPT['optimizer'])

    return model, optimizer

其他的参数可以通过以字典的方式获得

但是，但是，我们可能修改了一部分网络，比如加了一些，删除一些，等等，那么需要过滤这些参数，加载方式：

def load_checkpoint(model, checkpoint, optimizer, loadOptimizer):

    if checkpoint != 'No':

        print("loading checkpoint...")

        model_dict = model.state_dict()

        modelCheckpoint = torch.load(checkpoint)

        pretrained_dict = modelCheckpoint['state_dict']

        # 过滤操作

        new_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict.keys()}

        model_dict.update(new_dict)

        # 打印出来，更新了多少的参数

        print('Total : {}, update: {}'.format(len(pretrained_dict), len(new_dict)))

        model.load_state_dict(model_dict)

        print("loaded finished!")

        # 如果不需要更新优化器那么设置为false

        if loadOptimizer == True:

            optimizer.load_state_dict(modelCheckpoint['optimizer'])

            print('loaded! optimizer')

        else:

            print('not loaded optimizer')

    else:

        print('No checkpoint is included')

    return model, optimizer

2.冻结部分参数，训练另一部分参数

1）添加下面一句话到模型中

for p in self.parameters():

    p.requires_grad = False

比如加载了resnet预训练模型之后，在resenet的基础上连接了新的模快，resenet模块那部分可以先暂时冻结不更新，只更新其他部分的参数，那么可以在下面加入上面那句话

class RESNET_MF(nn.Module):

    def __init__(self, model, pretrained):

        super(RESNET_MF, self).__init__()

        self.resnet = model(pretrained)

        for p in self.parameters():

            p.requires_grad = False

        self.f = SpectralNorm(nn.Conv2d(2048, 512, 1))

        self.g = SpectralNorm(nn.Conv2d(2048, 512, 1))

        self.h = SpectralNorm(nn.Conv2d(2048, 2048, 1))

        ...

同时在优化器中添加：filter(lambda p: p.requires_grad, model.parameters())

optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=0.001, betas=(0.9, 0.999),

                               eps=1e-08, weight_decay=1e-5)

2) 参数保存在有序的字典中，那么可以通过查找参数的名字对应的id值，进行冻结

查找的代码：

    model_dict = torch.load('net.pth.tar').state_dict()

    dict_name = list(model_dict)

    for i, p in enumerate(dict_name):

        print(i, p)

保存一下这个文件，可以看到大致是这个样子的：

0 gamma

1 resnet.conv1.weight

2 resnet.bn1.weight

3 resnet.bn1.bias

4 resnet.bn1.running_mean

5 resnet.bn1.running_var

6 resnet.layer1.0.conv1.weight

7 resnet.layer1.0.bn1.weight

8 resnet.layer1.0.bn1.bias

9 resnet.layer1.0.bn1.running_mean

....

同样在模型中添加这样的代码：

for i,p in enumerate(net.parameters()):

    if i < 165:

        p.requires_grad = False

在优化器中添加上面的那句话可以实现参数的屏蔽

[Pytorch]Pytorch 保存模型与加载模型(转)的更多相关文章

PyTorch保存模型与加载模型+Finetune预训练模型使用
Pytorch 保存模型与加载模型 PyTorch之保存加载模型参数初始化参数的初始化其实就是对参数赋值.而我们需要学习的参数其实都是Variable,它其实是对Tensor的封装,同时提供了da ...
【4】TensorFlow光速入门-保存模型及加载模型并使用
本文地址:https://www.cnblogs.com/tujia/p/13862360.html 系列文章: [0]TensorFlow光速入门-序 [1]TensorFlow光速入门-tenso ...
莫烦python教程学习笔记——保存模型、加载模型的两种方法
# View more python tutorials on my Youtube and Youku channel!!! # Youtube video tutorial: https://ww ...
深度学习原理与框架-猫狗图像识别-卷积神经网络(代码) 1.cv2.resize(图片压缩) 2..get_shape()[1:4].num_elements(获得最后三维度之和) 3.saver.save(训练参数的保存) 4.tf.train.import_meta_graph(加载模型结构) 5.saver.restore(训练参数载入)
1.cv2.resize(image, (image_size, image_size), 0, 0, cv2.INTER_LINEAR) 参数说明:image表示输入图片,image_size表示变 ...
keras模型的保存与重新加载
# 模型保存JSON文件 model_json = model.to_json() with open('model.json', 'w') as file: file.write(model_jso ...
TensorFlow保存、加载模型参数 | 原理描述及踩坑经验总结
写在前面我之前使用的LSTM计算单元是根据其前向传播的计算公式手动实现的,这两天想要和TensorFlow自带的tf.nn.rnn_cell.BasicLSTMCell()比较一下,看看哪个训练速度 ...
MindSpore保存与加载模型
技术背景近几年在机器学习和传统搜索算法的结合中,逐渐发展出了一种Search To Optimization的思维,旨在通过构造一个特定的机器学习模型,来替代传统算法中的搜索过程,进而加速经典图论等 ...
NeHe OpenGL教程第三十一课：加载模型
转自[翻译]NeHe OpenGL 教程前言声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线 ...
学习笔记TF049:TensorFlow 模型存储加载、队列线程、加载数据、自定义操作
生成检查点文件(chekpoint file),扩展名.ckpt,tf.train.Saver对象调用Saver.save()生成.包含权重和其他程序定义变量,不包含图结构.另一程序使用,需要重新创建 ...

随机推荐

datasnap 关于lifecycle的问题
首先DSServerClass的lifecycle属性有Invocation.Server.Session三种模式: 简单叙述一下三点区别: server:datasnap只初始化一个TDSServe ...
网络编程 - socket通信/粘包/文件传输/udp - 总结
socket通信 1.简单的套接字通信 import socket phone = socket.socket(socket.AF_INET,socket.SOCK_STREAM) phone.bin ...
剑指Offer——第一个只出现一次的字符位置
题目描述: 在一个字符串(1<=字符串长度<=10000,全部由字母组成)中找到第一个只出现一次的字符,并返回它的位置. 分析: 用一个数组统计每个字符出现的次数. 再次扫描数组,如果找到 ...
安全测试之bWAPP环境搭建
本篇文章介绍独立安装部署bwapp. 安装环境:window7+IIS7+mysql5.6+php5.6 bWAPP下载地址:https://sourceforge.net/projects/bwap ...
Incorrect string value: '\xF0\x9F\x98\x84\xF0\x9F 表情插入mysql 报错
导致报错的问题是 emoji表情是4位 mysql 5.5.3版本以下数据库(utf8格式为3位),不支持.需要更新mysql5.5.3及以上的版本数据库并设置默认或者表或者字段的格式为 utf8mb ...
.Net站点架构设计（八）測试
.Net站点架构时间(八)測试一般而言.总体測试策略是:先针对部分系统进行性能及压力測试,得到各部分的峰值处理性能:再模拟总体流程測试,此时倒不用依照峰值跑,重点測试总体业务流程及业务预期负荷. 在 ...
JSON 序列化与反序列化（二）使用TypeReference 构建类型安全的异构容器
1. 泛型通常用于集合,如Set和Map等.这样的用法也就限制了每个容器只能有固定数目的类型参数,一般来说,这也确实是我们想要的. 然而有的时候我们需要更多的灵活性,如数据库可以用任意多的Column ...
SQL Server扩展事件-- 使用system_health默认跟踪会话监控死锁
SQL Server扩展事件(Extended Events)-- 使用system_health默认跟踪会话监控死锁转自:http://blog.51cto.com/ultrasql/160037 ...
脚本其实很简单-windows配置核查程序（1）
先上成品图需求描述我们电脑上都安装各种过监控软件,比如360.鲁大师等等...其中有一个功能就是性能监控,在安全行业里面通常叫做"配置核查",目的就是将主机的各种性能指标展示, ...
模块讲解----sys
sys:跟python解释器相关的信息 #命令行参数list,第一个元素时程序本身路径 print(sys.argv) 注意:执行脚本时,可以传参数. #退出程序,正常退出时exit(0) sys.e ...

[Pytorch]Pytorch 保存模型与加载模型(转)

1.保存模型与加载

2.冻结部分参数，训练另一部分参数

[Pytorch]Pytorch 保存模型与加载模型(转)的更多相关文章

随机推荐

热门专题