以最佳的101 layer的ResNet-DUC为基础，添加HDC，实验探究了几种变体：

无扩张卷积(no dilation)：对于所有包含扩张卷积，设置r=1r=1
扩张卷积(dilation Conv )：对于所有包含扩张卷积，将2个block和为一组，设置第一个block的r=2r=2，第二个block的r=1r=1
Dilation-RF：对于res4bres4b包含了23个blocks，使用的r=2r=2，设置3个block一组，r=1,2,3r=1,2,3.对于最后两个block，设置r=2r=2；对于res5bres5b，包含3个block,使用r=4r=4，设置为r=3,4,5r=3,4,5.
Dilation-Bigger：对于res4bres4b模块，设置4个block为一组，设置r=1,2,5,9r=1,2,5,9.最后3个block设置为1,2,51,2,5；对于res5bres5b模块，设置r=5,9,17r=5,9,17

可以看到增加接收野大小会获得较高的精度。如下图所示：

ResNet-DUC-HDC在较大的目标物上表现较好。下图是局部放大：

可以看到HDC有效的消除”gridding”产生的影响。

Deeper Networks：同样尝试了将ResNet-101切换为ResNet-152，使用ResNet152先跑了10个epoch学习了BN层参数，再固定BN层，跑了20个epochs.结果如下：

ResNet152为基础层的有1%的提升。

Test Set Results：论文将ResNet101开始的7×77×7卷积拆分为3个3×33×3的卷积，再不带CRF的情况下达到了80.1%mIoU.与其他先进模型相比如下：

模型同时在coarse labels跑了一圈，与同样以deliated convolution为主的DeepLabv2相比，提升了9.7%.

KITTI Road Segmentaiton

KITTI有289的训练图片和290个测试图片。示例如下：

因为数据集有限，为了避免过拟合。论文以100的步长在数据集中裁剪320×320320×320的patch. 使用预训练模型，结果如下：

结果达到了state-of-the-art水平.

PASCAL VOC2012 dataset

先用VOC2012训练集和MS-COCO数据集对ResNet-DUC做预训练。再使用VOC2012做fine-tune。使用的图片大小为512×512512×512。达到了state-of-the-art水平：

可视化结果如下：

Conclusion

论文提出了简单有效的卷积操作改进语义分割系统。使用DUC恢复上采样丢失的信息，使用HDC在解决”gridding”的影响的同时扩大感受野。实验证明我们的框架对各种语义分割任务的有效性。

理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）的更多相关文章

理解NLP中的卷积神经网络（CNN）
此篇文章是Denny Britz关于CNN在NLP中应用的理解,他本人也曾在Google Brain项目中参与多项关于NLP的项目. · 翻译不周到的地方请大家见谅. 阅读完本文大概需要7分钟左右的时 ...
[转] 理解NLP中的卷积&&Pooling
转自:http://blog.csdn.net/malefactor/article/details/51078135 CNN是目前自然语言处理中和RNN并驾齐驱的两种最常见的深度学习模型.图1展示了 ...
彻底理解数字图像处理中的卷积-以Sobel算子为例
彻底理解数字图像处理中的卷积-以Sobel算子为例作者:FreeBlues 修订记录 2016.08.04 初稿完成概述卷积在信号处理领域有极其广泛的应用, 也有严格的物理和数学定义. 本文只讨 ...
caffe中全卷积层和全连接层训练参数如何确定
今天来仔细讲一下卷基层和全连接层训练参数个数如何确定的问题.我们以Mnist为例,首先贴出网络配置文件: name: "LeNet" layer { name: "mni ...
[翻译] 扩张卷积 (Dilated Convolution)
英文原文: Dilated Convolution 简单来说,扩张卷积只是运用卷积到一个指定间隔的输入．按照这个定义,给定我们的输入是一个2维图片,扩张率 k=1 是通常的卷积,k=2 的意思是每个输 ...
[转]CNN 中千奇百怪的卷积方式大汇总
https://www.leiphone.com/news/201709/AzBc9Sg44fs57hyY.html 推荐另一篇很好的总结:变形卷积核.可分离卷积?卷积神经网络中十大拍案叫绝的操作. ...
CNN中千奇百怪的卷积方式大汇总
1.原始版本最早的卷积方式还没有任何骚套路,那就也没什么好说的了. 见下图,原始的conv操作可以看做一个2D版本的无隐层神经网络. 附上一个卷积详细流程: [TensorFlow]tf.nn.co ...
从图(Graph)到图卷积(Graph Convolution)：漫谈图神经网络模型 (二)
本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...
从图(Graph)到图卷积(Graph Convolution)：漫谈图神经网络模型 (一)
本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...

随机推荐

complex figure
1/z ----direct by MATLAB exp(z) by QT logZ by QT 1/z 用QT画的 -----2018-03-17--------- ...
Jenkins实现Android自动化打包
转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/77102359 本文出自[赵彦军的博客] 1.Tomcat 进入 https://t ...
ORACLE 数据库选择性导出表中数据&导入已存在表数据
在dos界面下选择性导出表中的数据语句为: exp his/linker@orcl tables=(sysreprot) file="D:\20131218.dmp" query= ...
webpack学习之路01
webpack是什么 1.模块化能将css等静态文件模块化 2.借助于插件和加载器 webpack优势是什么 1.代码分离各做各的 2.装载器(css,sass,jsx,es6等等) 3.智能解析 ...
python爬虫入门（二）Opener和Requests
Handler和Opener Handler处理器和自定义Opener opener是urllib2.OpenerDirector的实例,我们之前一直在使用urlopen,它是一个特殊的opener( ...
java多线程对CountDownLatch的使用实例
介绍 CountDownLatch是一个同步辅助类,它允许一个或多个线程一直等待直到其他线程执行完毕才开始执行. 用给定的计数初始化CountDownLatch,其含义是要被等待执行完的线程个数. 每 ...
iframe跨域动态设置主窗口宽高
Q:在A项目的a页面嵌入一个iframe,src是B项目的b页面,怎样让a页面的高度跟b页面的高度一样? A:解决跨域方案:增加一个A项目的c页面. 操作步骤: 一,a页面的iframe设置: 获取到 ...
为什么要使用ThreadLocalRandom代替Random生成随机数
799 java里有伪随机型和安全型两种随机数生成器,伪随机生成器根据特定公式将seed转换成新的伪随机数据的一部分,安全随机生成器在底层依赖到操作系统提供的随机事件来生成数据. 安全随机生成器需要 ...
Socket TCP/UDP
TCP TCPClient package com.tcp; import java.io.*; import java.net.*; class TCPClient { public static ...
Linux共享库、静态库、动态库详解
1. 介绍使用GNU的工具我们如何在Linux下创建自己的程序函数库?一个“程序函数库”简单的说就是一个文件包含了一些编译好的代码和数据,这些编译好的代码和数据可以在事后供其他的程序使用.程序函数库 ...

理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）

KITTI Road Segmentaiton

PASCAL VOC2012 dataset

Conclusion

理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）的更多相关文章

随机推荐

热门专题