dense prediction

Dense prediction

fully convolutional network for sementic segmentation

先用feature extractor 提特征，然后再使用加入upsample层，得到dense prediction。

这里的‘deconvolution’其实不是真正的反卷积。作者给出了几种方案，实际中使用‘transposed convolution’(在matconvnet 中就叫convtranspose)，转置卷积只是恢复了其形状，并未对其值进行恢复，这也是为什么将其称为反卷积不合适的原因了

No zero padding，uint stride：理解为正向卷积padding 为0.转置卷积为full padding

Fractional Strided Convolution：使用大于1的stride（对于正向卷积）来upsampleing，fractional stride convolution 微步卷积。带洞是为了使转置卷积的步长变为正向卷积的1/i倍。

参考： https://github.com/vdumoulin/conv_arithmetic

转置卷积：

什么是真正的deconvolution？

针对直接upsample的结果不好的情况，使用浅层特征进行辅助。但是对于小的目标依然有检测不到的情况，对于大目标又检测不对。

accurate image super-resolution using very deep convolutional network

网络中全部使用卷积层，只用了一个尺度。可能对于超分辨还行，因为每个像素只与周围的几个像素有关（其实不太懂）

dense prediction的更多相关文章

dense prediction问题
dense prediction 理解:标注出图像中每个像素点的对象类别,要求不但给出具体目标的位置,还要描绘物体的边界,如图像分割.语义分割.边缘检测等等. 基于深度学习主要的做法有两种: 基于图 ...
Anchor-free目标检测综述 -- Dense Prediction篇
早期目标检测研究以anchor-based为主,设定初始anchor,预测anchor的修正值,分为two-stage目标检测与one-stage目标检测,分别以Faster R-CNN和SSD作 ...
论文阅读（Xiang Bai——【arXiv2016】Scene Text Detection via Holistic, Multi-Channel Prediction）
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录作者和相关链接方法概括创新 ...
Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）
摘要卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有 ...
大规模视觉识别挑战赛ILSVRC2015各团队结果和方法 Large Scale Visual Recognition Challenge 2015
Large Scale Visual Recognition Challenge 2015 (ILSVRC2015) Legend: Yellow background = winner in thi ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
OSVOS 半监督视频分割入门论文（中文翻译）
摘要: 本文解决了半监督视频目标分割的问题.给定第一帧的mask,将目标从视频背景中分离出来.本文提出OSVOS,基于FCN框架的,可以连续依次地将在IMAGENET上学到的信息转移到通用语义信息,实 ...
论文阅读笔记六：FCN：Fully Convolutional Networks for Semantic Segmentation(CVPR2015)
今天来看一看一个比较经典的语义分割网络,那就是FCN,全称如题,原英文论文网址:https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn ...
人工智能必须要知道的语义分割模型：DeepLabv3+
图像分割是计算机视觉中除了分类和检测外的另一项基本任务,它意味着要将图片根据内容分割成不同的块.相比图像分类和检测,分割是一项更精细的工作,因为需要对每个像素点分类,如下图的街景分割,由于对每个像素点 ...

随机推荐

html 列表 ol 、ul 、dl
html的列表分為無序列表(ul).有序列表(ol).自定義列表(dl). 無序列表: 以<ul>開始,列表項以<li>開始: 列表項可以是段落.圖像.連接.換行符.列表等: ...
face parsing
主页:https://www.sifeiliu.net/project 基于CNN face parsing: https://www.sifeiliu.net/face-parsing codes: ...
企业网管用linux搭建邮件服务器为公司降本增效
在企业中,节约一分钱比挣一分钱容易得多,这是指导企业降本增效的名言之一啊,作为一名企业里的IT人员我是深有感触,尤其是IT方面,除了在互联网公司是生产力的排头兵,在制造业单位里那一般都是后勤保障部门, ...
python----面对对象三大特征2
多态什么是多态?多态指的是一类事物有多种形态,例如一个动物类,狗和猫都通过继承动物类来得来,这样我们可以将狗.猫称作动物类的另一种形态. 在java中也存在多态,java中的多态是用来解决在一个函数 ...
FileStream文件流
操作字节文件流和文件的区别文件不管大小,一次读写文件流可以分块读写 //文件流的资源GC不会释放,所以需要使用using using (FileStream fsRead = new FileS ...
php-编译模块1
在路径中找到phpize 在需要编译的模块文件夹中执行如: /usr/bin/phpize Configuring for: PHP Api Version: 20131106 Zend Modul ...
BZOJ1070[SCOI2007]修车——最小费用最大流
题目描述同一时刻有N位车主带着他们的爱车来到了汽车维修中心.维修中心共有M位技术人员,不同的技术人员对不同的车进行维修所用的时间是不同的.现在需要安排这M位技术人员所维修的车及顺序,使得顾客平均等待 ...
LOJ117 有源汇有上下界最小流（上下界网络流）
跑出可行流后从原来的汇点向原来的源点跑最大流,原图最小流=inf-maxflow.显然超源超汇的相关边对其也没有影响.原图最小流=可行流-原图新增流量,因为t向s流量增加相当于s向t流量减少.但为什么 ...
BZOJ4012 HNOI2015开店（树链剖分+主席树）
考虑这样一个问题:一棵树初始全是白点,有两种操作:把一个点染黑:询问某点到所有黑点的距离之和. 注意到树上两点x和y的距离为depth[x]+depth[y]-depth[lca(x,y)]*2.要求 ...
Linux LVM逻辑卷配置过程详解（创建，增加，减少，删除，卸载）
Linux LVM逻辑卷配置过程详解许多Linux使用者安装操作系统时都会遇到这样的困境:如何精确评估和分配各个硬盘分区的容量,如果当初评估不准确,一旦系统分区不够用时可能不得不备份.删除相关数据, ...

dense prediction

dense prediction的更多相关文章

随机推荐

热门专题