（原）torch模型转pytorch模型

转载请注明出处：

http://www.cnblogs.com/darkknightzh/p/7839263.html

目前使用的torch模型转pytorch模型的程序为：

https://github.com/clcarwin/convert_torch_to_pytorch

该程序中，常见的模型都可以转换，但是对于torch中为BatchNormalization的则会提示出错：

Not Implement BatchNormalization

torch中的SpatialBatchNormalization对应于输入为4d的特征（batchsize*featdim*featHeight*featWidth），对应于pytorch中的nn.BatchNorm2d。

而torch中的BatchNormalization对应于输入为2d的特征（batchsize*featdim），对应于pytorch中的nn.BatchNorm1d。

因而修改方法很简单：

1. 在convert_torch.py的行（elif name == 'ReLU':）之前添加：

elif name == 'BatchNormalization':

    n = nn.BatchNorm1d(m.running_mean.size(0), m.eps, m.momentum, m.affine)

    copy_param(m,n)

    add_submodule(seq,n)

2. 在convert_torch.py的（未修改前的）行（elif name == 'ReLU':）之前添加：

elif name == 'BatchNormalization':

    s += ['nn.BatchNorm1d({},{},{},{}),#BatchNorm1d'.format(m.running_mean.size(0), m.eps, m.momentum, m.affine)]

3. 在convert_torch.py的（未修改前的）行（s = map(lambda x: x.replace(',(0, 0),ceil_mode=False),#MaxPool2d',')'),s)）之前添加：

s = map(lambda x: x.replace(',1e-05,0.1,True),#BatchNorm1d',')'),s)

s = map(lambda x: x.replace('),#BatchNorm1d',')'),s)

经过上述修改后，torch模型中含有BatchNormalization，转换到pytorch后的模型性能和转换前的模型性能一致。

顺便说一下，2天前更新的该程序，添加了BatchNorm3d的支持，但是在243、244行之后，并没有增加BatchNorm3d的相关代码，不清楚是否会有问题。我这边没有用到BatchNorm3d，因而没有测试。

另一方面，上面的3步中，我是根据BatchNorm2d去修改，没有测试如果不修改某一步（如第3步），程序是否会有问题。反正都改了，模型没有问题。。。

（原）torch模型转pytorch模型的更多相关文章

生产与学术之Pytorch模型导出为安卓Apk尝试记录
生产与学术写于 2019-01-08 的旧文, 当时是针对一个比赛的探索. 觉得可能对其他人有用, 就放出来分享一下生产与学术, 真实的对立... 这是我这两天对pytorch深度学习->a ...
将Pytorch模型从CPU转换成GPU
1. 如何进行迁移对模型和相应的数据进行.cuda()处理.通过这种方式,我们就可以将内存中的数据复制到GPU的显存中去.从而可以通过GPU来进行运算了. 1.1 判定使用GPU 下载了对应的GPU ...
使用C++调用pytorch模型(Linux)
前言模型转换思路通常为: Pytorch -> ONNX -> TensorRT Pytorch -> ONNX -> TVM Pytorch -> 转换工具 -> ...
使用C++调用并部署pytorch模型
1.背景(Background) 上图显示了目前深度学习模型在生产环境中的方法,本文仅探讨如何部署pytorch模型! 至于为什么要用C++调用pytorch模型,其目的在于:使用C++及多线程可以加 ...
DEX-6-caffe模型转成pytorch模型办法
在python2.7环境下文件下载位置:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/ 1.可视化模型文件prototxt 1)在线可视化 ...
PyTorch模型加载与保存的最佳实践
一般来说PyTorch有两种保存和读取模型参数的方法.但这篇文章我记录了一种最佳实践,可以在加载模型时避免掉一些问题. 第一种方案是保存整个模型: 1 torch.save(model_object, ...
从零搭建Pytorch模型教程（三）搭建Transformer网络
前言本文介绍了Transformer的基本流程,分块的两种实现方式,Position Emebdding的几种实现方式,Encoder的实现方式,最后分类的两种方式,以及最重要的数据格式的介绍. ...
Pytorch模型量化
在深度学习中,量化指的是使用更少的bit来存储原本以浮点数存储的tensor,以及使用更少的bit来完成原本以浮点数完成的计算.这么做的好处主要有如下几点: 更少的模型体积,接近4倍的减少: 可以更快 ...
计算机网络原理和OSI模型与TCP模型
计算机网络原理和OSI模型与TCP模型一.计算机网络的概述 1.计算机网络的定义计算机网络是一组自治计算机的互连的集合 2.计算机网络的基本功能 a.资源共享 b.分布式处理与负载均衡 c.综合信 ...

随机推荐

Qt OpenGL:学习现代3D图形编程之四，透视投影浅析
一.非真实的世界与之前几篇文章不同的是,这里要画12个三角形,这个12个三角形构造一个方形棱柱(这里为长方体).棱柱的每个四边形表面由两个三角形组成.这两个三角形其中的一条边重合,而且它们的六个顶点 ...
android 巧用动画使您app风骚起来
巧用Android的自定义动画,使你更加的有动感,是大多数Android开发人员的目标,那怎么做到这点.请听下文分解: 3.0以前,android支持两种动画模式,tween animation(幅间 ...
windows 使用 xxfpm 解决 php-cgi 进程自动关闭
windows 下 php-cgi 进程处理一定数量的访问后,就会自动关闭,由于没办法直接让 php-cgi 进程支持更多的访问数量,所以只能启动多个进程来满足需求. xxfpm 是一个可执行程序,它 ...
【使用JSOUP实现网络爬虫】修改数据-设置属性的值
问题在你解析一个Document之后可能想修改其中的某些属性值,然后再保存到磁盘或都输出到前台页面. 方法可以使用属性设置方法 Element.attr(String key, String va ...
Linq-Contains查询
customers.Where(c => c.Name.Contains("john"));
MongoDB: 如何删除一个collection中的一个字段？
Try this: If your collection was 'example' db.example.update({}, {$unset: {words:1}}, false, true) ...
例子：使用Grunt创建一个Node.js类库
创建一个文件夹. 打开命令行或者powershell, 运行npm init,根据提示填入package的信息. 在文件夹中创建index.js文件. /*! * mymongolib * Cop ...
Intercepting a 404 in IIS 7 and up
Lately I've been working on a system that needs to serve flat files, which is what IIS is very goo ...
I/O Mutiplexing poll 和 epoll
上一篇介绍了select的基本用法,接着来学习一下poll和epoll的基本用法.首先来看poll: #include <sys/poll.h> int poll (struct poll ...
intellij idea 插件安装、卸载
windows 下 intellij idea 插件安装.卸载安装(在线安装): 根据图一.图二所示(蓝色标记) 卸载: 根据图一所示(橙色标记) 启用.关闭插件: 根据图一所示(绿色标记) 安 ...

（原）torch模型转pytorch模型

（原）torch模型转pytorch模型的更多相关文章

随机推荐

热门专题