pytorch faster

代码地址：https://github.com/jwyang/faster-rcnn.pytorch

1.fasterRCNN.train():这个不是让网络进行训练，而是让module in training mode，有些module在traing model和testing model下不同,比如bn

即self.training这个成员变量为true(这个成员变量属于nn.Module,fasterRCNN继承了这个成员变量)，以下是train成员函数的源码

2.bn的train和test不同，train的时候应该是要学习参数的，test的时候关闭，pytorch的用法如下：

pytorch的batchnorm使用时需要小心，training和track_running_stats可以组合出三种behavior，很容易掉坑里（我刚发现我对track_running_stats的理解错了）。

training=True, track_running_stats=True, 这是常用的training时期待的行为，running_mean 和running_var会跟踪不同batch数据的mean和variance。
training=True, track_running_stats=False, 这时候batchnorm不跟踪跨batch数据的statistics了，而是用每个batch的mean和variance做normalization。
training=False, track_running_stats=True, 这是我们期待的test时候的行为，即使用training阶段估计的running_mean 和running_var.
training=False, track_running_stats=False，同2(!!!).

https://www.zhihu.com/question/282672547/answer/529154567李韶华的回答

3.class_agnostic == true就是所有类别回归同一个坐标，也就是一个框回归一个坐标

　　　　　　　　== false是每个类别单独回归4个坐标

    if self.class_agnostic:

      self.RCNN_bbox_pred = nn.Linear(4096, 4)

    else:

      self.RCNN_bbox_pred = nn.Linear(4096, 4 * self.n_classes)

4.真正开始训练的代码不是fasterRCNN.train()，而是下面这段代码：

      rois, cls_prob, bbox_pred, \

      rpn_loss_cls, rpn_loss_box, \

      RCNN_loss_cls, RCNN_loss_bbox, \

      rois_label = fasterRCNN(im_data, im_info, gt_boxes, num_boxes)

fasterRCNN是一个实例，应该是没办法进行调用的，但实际上这段代码执行的是forward函数。为什么？其实就是python的括号重载。fasterRCNN这个实例继承于nn.Module类，这个类定义了forward成员函数，nn.Module类使用了__call__进行了重载，让实例能够调用，并且调用的函数是forward函数，具体代码见下面的源码：

python中__call__函数的作用是使实例能够像函数一样被调用https://blog.csdn.net/Yaokai_AssultMaster/article/details/70256621，也称之为括号重载，即‘()’

    def __call__(self, *input, **kwargs):

        for hook in self._forward_pre_hooks.values():

            hook(self, input)

        if torch._C._get_tracing_state():

            result = self._slow_forward(*input, **kwargs)

        else:

            result = self.forward(*input, **kwargs)

        for hook in self._forward_hooks.values():

            hook_result = hook(self, input, result)

            if hook_result is not None:

                raise RuntimeError(

                    "forward hooks should never return any values, but '{}'"

                    "didn't return None".format(hook))

        if len(self._backward_hooks) > 0:

            var = result

            while not isinstance(var, torch.Tensor):

                if isinstance(var, dict):

                    var = next((v for v in var.values() if isinstance(v, torch.Tensor)))

                else:

                    var = var[0]

            grad_fn = var.grad_fn

            if grad_fn is not None:

                for hook in self._backward_hooks.values():

                    wrapper = functools.partial(hook, self)

                    functools.update_wrapper(wrapper, hook)

                    grad_fn.register_hook(wrapper)

        return result

nn.Module定义了一个forward的成员函数，这个函数在基类中没有实现，而是在各个子类自己实现的，每个子类都必须实现forward函数：

    def forward(self, *input):

        r"""Defines the computation performed at every call.

        Should be overridden by all subclasses.

        .. note::

            Although the recipe for forward pass needs to be defined within

            this function, one should call the :class:`Module` instance afterwards

            instead of this since the former takes care of running the

            registered hooks while the latter silently ignores them.

        """

        raise NotImplementedError

子类调用forward函数不能直接用calss.forward()，而是用实例的函数调用，具体的原因好像是hook，这个在上面__call__函数中也看到调用forward使用了跟hook有关的input

pytorch faster_rcnn的更多相关文章

Faster_RCNN 4.训练模型
总结自论文:Faster_RCNN,与Pytorch代码: 本文主要介绍代码最后部分:trainer.py .train.py , 首先分析一些主要理论操作,然后在代码分析里详细介绍其具体实现.首先 ...
Faster_RCNN 3.模型准备(下)
总结自论文:Faster_RCNN,与Pytorch代码: 本文主要介绍代码第二部分:model/ , 首先分析一些主要理论操作,然后在代码分析里详细介绍其具体实现. 首先在参考文章的基础上进一步详细 ...
Faster_RCNN 2.模型准备(上)
总结自论文:Faster_RCNN,与Pytorch代码: 本文主要介绍代码第二部分:model/utils , 首先分析一些主要理论操作,然后在代码分析里详细介绍其具体实现. 一. 主要操作 1. ...
Faster_RCNN 1.准备工作
总结自论文:Faster_RCNN,与Pytorch代码: 代码结构: simple-faster-rcnn-pytorch.py data __init__.py dataset.py util. ...
目标检测之Faster-RCNN的pytorch代码详解(模型训练篇)
本文所用代码gayhub的地址:https://github.com/chenyuntc/simple-faster-rcnn-pytorch (非本人所写,博文只是解释代码) 好长时间没有发博客了 ...
PyTorch专栏（八）：微调基于torchvision 0.3的目标检测模型
专栏目录: 第一章:PyTorch之简介与下载 PyTorch简介 PyTorch环境搭建第二章:PyTorch之60分钟入门 PyTorch入门 PyTorch自动微分 PyTorch神经网络 P ...
faster_rcnn c++版本的 caffe 封装，动态库（2）
摘要: 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ github上的代码链接,求给星星:) https:// ...
Ubutnu16.04安装pytorch
1.下载Anaconda3 首先需要去Anaconda官网下载最新版本Anaconda3(https://www.continuum.io/downloads),我下载是是带有python3.6的An ...
解决运行pytorch程序多线程问题
当我使用pycharm运行 (https://github.com/Joyce94/cnn-text-classification-pytorch ) pytorch程序的时候,在Linux服务器 ...

随机推荐

导航栏pop拦截
一.新建一个分类二.导入分类头文件三.需要拦截的地方实现方法 - (BOOL)navigationShouldPopTwo 即可 .h #import <UIKit/UIKit.h&g ...
Tunnel Warfare（hdu1540 线段树）
Tunnel Warfare Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) T ...
js-jQuery性能优化（二）
5.数组方式使用jQuery对象使用jQuery选择器获取结果是一个jQuery对象.然而,jQuery类库会让你感觉正在使用一个定义了索引和长度的数组.在性能方面,建议使用简单的for或者whil ...
vertical-align 详解
vertical-align用来设置垂直对齐方式,所有垂直对齐的元素都会影响行高值: baseline | sub | super | top | text-top | middle | botto ...
个人理解的Lambda表达式的演化过程
之前在组内进行过相关分享,为防止以后再单独整理,故在此将自己的PPT内容存放下. 所以,多数代码都是以图片的方式展现. 委托什么是委托? 定义:委托是方法的抽象,它存储的就是一系列具有相同签名和返回 ...
MySql 利用mysql&mysqldum导入导出数据
MySql 利用mysql&mysqldum导入导出数据 by:授客 QQ:1033553122 测试环境 Linux下测试,数据库MySql 工具 mysqldump,该命令位于mysq ...
sql求两表的并集、交集、非交集、差集、结果集排序
create table A( id ,) Not null primary key, name ) not null default(''), ) INSERT INTO [A]([name]) V ...
阿里云rds实例恢复到本地
摘要: 前提: 1,阿里云数据库备份实例,恢复数据的时候需要将数据恢复到本地数据库,是不能直接恢复到RDS上的. 2,需要在本地服务器上下载一个数据库,尽量和RDS数据库版本保持一致.(我现在用的是5 ...
pt-osc原理、限制、及与原生online-ddl比较
1. pt-osc工作过程创建一个和要执行 alter 操作的表一样的新的空表结构(是alter之前的结构) 在新表执行alter table 语句(速度应该很快) 在原表中创建触发器3个触发器分别 ...
Servlet_Struts2
百度云链接:https://pan.baidu.com/s/1TNkQ8KN2t1xJFcf_CnTXDQ 密码:i3w8 修改中...

pytorch faster_rcnn

pytorch faster_rcnn的更多相关文章

随机推荐

热门专题