deeplab hole algorithm

最近看了几篇文章，其中均用到了hole algorithm。

最早用的就是deeplab的文章了，Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFS 这篇文章和fcn不同的是，在最后产生score map时，不是进行upsampling，而是采用了hole algorithm，就是在pool4和pool5层，步长由2变成1，必然输出的score map变大了，但是receptive field也变小了，为了不降低receptive field，怎么做呢？利用hole algorithm，将卷积weights膨胀扩大，即原来卷积核是3x3，膨胀后，可能变成7x7了，这样receptive field变大了，而score map也很大，即输出变成dense的了。

这么做的好处是，输出的score map变大了，即是dense的输出了，而且receptive field不会变小，而且可以变大。这对做分割、检测等工作非常重要。

基于这个做检测的文章：SSD: Single Shot MultiBox Detector

接下来做分割的文章：Learning Dense Convolutional Embeddings for Semantic Segmentation Multi-Scale Context Aggregation by Dilated Convolutions

后来经同事提醒，回头看了看xiaogang wang的文章，Highly Efficient Forward and Backward Propagation of Convolutional Neural Networks for PixelwiseClassification 确实是一样的，但是他们的这篇文章引用率却不咋地啊，可能也和他们的开源态度有关系吧，他们只放出来部分代码，没诚心啊。

和同事讨论这个算法，我同事觉得这个后面的卷积核的变化必须和前面的pooling协调使用。可我始终觉得没有这个限定啊，目前都是这样用，是因为基本上都是用pooling进行降维，而不是convlution，感觉从文章里看也是没这个限定啊。当然如果能协调使用，就最大限度保证了位置信息，但是pooling步长变化了，其实严格来讲，已经不完全和之前的模型完全一样了，已经有变化了，但是如果不协调使用的话，变化就会更大了。而且如果从receptive field的角度来讲，其实是可以变化的，也就是说可以把receptive field变大，而且可以变的很大，而不是仅仅保持不变小，感觉其实hole algorithm的存在，一方面原因也是不想让receptive field变小。

这两篇文章都是我讲的，估计过几天我又忘记了。

deeplab hole algorithm的更多相关文章

转　SSD论文解读
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/u010167269/article/det ...
关于SSD和YOLO对小目标的思考
所谓的小目标,要看是绝对小目标(像素),和相对小目标(相对原图的长宽来看的).大目标小目标只跟receptive field(感受野)有关,cnn本身可以检测任何尺度的物体.ssd对小目标检测不太适用 ...
论文阅读之：Is Faster R-CNN Doing Well for Pedestrian Detection?
Is Faster R-CNN Doing Well for Pedestrian Detection? ECCV 2016 Liliang Zhang & Kaiming He 原文链接 ...
R-FCN论文翻译
R-FCN论文翻译 R-FCN: Object Detection viaRegion-based Fully Convolutional Networks 2018.2.6 论文地址:R-FCN ...
【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)
这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...
中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...
Mesh Algorithm in OpenCascade
Mesh Algorithm in OpenCascade eryar@163.com Abstract. Rendering a generic surface is a two steps pro ...
《In Search of an Understandable Consensus Algorithm》翻译
Abstract Raft是一种用于管理replicated log的consensus algorithm.它能和Paxos产生同样的结果,有着和Paxos同样的性能,但是结构却不同于Paxos:它 ...
POJ 1584 A Round Peg in a Ground Hole --判定点在形内形外形上
题意: 给一个圆和一个多边形,多边形点可能按顺时针给出,也可能按逆时针给出,先判断多边形是否为凸包,再判断圆是否在凸包内. 解法: 先判是否为凸包,沿着i=0~n,先得出初始方向dir,dir=1为逆 ...

随机推荐

Python体验(09)-图形界面之Pannel和Sizer
import wx class Form(wx.Frame): def __init__(self,parent,ID,title): wx.Frame.__init__(self,parent,ID ...
OpenCV2.3.1在Win7+VS2010下的配置过程(转)
转自:http://blog.csdn.net/mygis2005/article/details/10472717 这篇博客很好的解决了我遇到的问题,所以转到自己的博客里,方便以后进行查阅. 1． ...
Chrome插件概览（一） – The basics
转载http://lvjava.com/?p=582 原文见https://developer.chrome.com/extensions/overview.html Chrome Extension ...
shell return value
oracle加并行参数PARALLEL
select /*+ PARALLEL(t,4) */ * from table1
C++对象模型详解
原文链接:吴秦大神的C++对象模型. 何为C++对象模型? C++对象模型可以概括为以下2部分: 1.语言中直接支持面向对象程序设计的部分: 2.对于各种支持的底层实现机制. 语言中直接支持面向对象程 ...
Cordova webapp实战开发（20161207 ）
http://www.cnblogs.com/zhoujg/archive/2015/05/28/4534932.html 1.https://www.jetbrains.com/idea/downl ...
浅谈 JS 创建对象的 8 种模式
1.Object 模式 var o1 = {};//字面量的表现形式 var o2 = new Object; var o3 = new Object(); var o4 = new Object(n ...
C语言字符输出格式化
转自http://blog.csdn.net/pbymw8iwm/article/details/8153226 符号属性长度属性基本型所占位数取值范围输入符举例输出符举例 -- -- ...
ATL开发 ActiveX控件的 inf文件模板
ATL开发 ActiveX控件的 inf文件模板

deeplab hole algorithm

deeplab hole algorithm的更多相关文章

随机推荐

热门专题