论文笔记《Fully Convolutional Networks for Semantic Segmentation》

一、Abstract

提出了一种end-to-end的做semantic segmentation的方法，也就是FCN，是我个人觉得非常厉害的一个方法。

二、亮点

1、提出了全卷积网络的概念，将Alexnet这种的最后的全连接层转换为卷积层，好处就是可以输入任意的scale。

只不过在输出的scale不同的时候，feature map的大小也不同，因为这里的目的是最piexl的语义分割，所以其实不重要。

在Alexnet基础上, 最后的channel=4096的feature map经过一个1x1的卷积层, 变为channel=21的feature map, 然后经过上采样和crop, 变为与输入图像同样大小的channel=21的feature map, 也就是图中的pixel-wise prediction。在Longjon的试验中一共有20个语义类别, 加上背景类别每个像素应该有21个softmax预测类, 因此pixel-wise prediction中channel=21。

2、如何做上采样的？

对CNN的输出结果进行upsampling，上采样的参数是可学习的，这里采用的方法是反卷积，其实跟BP的求卷积层的梯度是一样的算法，最后得到一个和原图一样大小的输出，输出结果为对每个像素的分类。

3、如何把全连接层转换为卷积层？

这篇博文写的很好http://blog.csdn.net/u010668083/article/details/46650877，这里有一个概念我之前一直模糊了，把全连接层转换为卷积层，实际上是用一个和输入的图像一样大小的卷积核去做这个操作。对于一个7*7*512的cov输出，连接到一个1*1*4096的全连接层，转换的方法也就是：用4096组滤波器，每组滤波器有512组，每组的大小是7*7的（所以我的理解就是..这个滤波器的大小实际上是7*7*512），这样的话，参数数量一致，最后的输出也是一致的。在输出变大的时候，因为是都是卷积层，最后当然可以得到一个上面那张图的输出。

4.refinement

作者发现，直接这样做效果并不是很好，于是拿出了祖传trick来解决问题了。

如下图所示，在最后upsampling的时候，不只用最后一层，还要结合前面几层一起来做一个fusion，这个很好理解，前面几层的感受野是比较小的，所以在局部的输出结果上是不错的，而后面的输出感受野是越来越大的，可以说准确率会高一点，进行融合以后，效果好的飞起..

三、结论

语义分割方面FCN可以说是开了一个山头了，我觉得这个想法很好，对于之后的instance segmentation也有很大的帮助。

论文笔记《Fully Convolutional Networks for Semantic Segmentation》的更多相关文章

《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
[place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析（转）
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果用5G的计算量和25M的参数. ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
论文笔记：ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
论文笔记：DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
论文笔记：Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
论文笔记：Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

PHP中可变变量到底有什么用？
转自:http://blog.csdn.net/engine_1124/article/details/8660291 什么是可变变量? PHP提供了一种其他类型的变量——可变变量.可变变量允许我们动 ...
面向对象编程 -------JavaScrip
本文摘要:http://www.liaoxuefeng.com/ 一定明白面向对象的两个基本概念: 类:类是对象的类型模板,例如,定义Student类来表示学生,类本身是一种类型,Student表示学 ...
Linux菜鸟起飞之路【一】基本知识与Linux的安装
一.操作系统基本常识 1.操作系统的定义:操作系统是用来协调.管理和控制计算机硬件与软件资源的系统程序,介于硬件与应用程序之间. 2.操作系统内核的定义:操作系统内核是一个管理和控制程序,负责管理计算 ...
2019年Vue学习路线图
https://juejin.im/entry/5c108864f265da61726555ed 官网: https://cn.vuejs.org/index.html js引入地址 https:// ...
Python While循环、运算符以及一些基础运用
1.循环语句循环打印"人生苦短,我用python" while True: print("人生苦短,我用python") 利用While循环,打印1~10 c ...
Volatile小结
1)Java 中能创建 Volatile 数组吗? 能,Java 中可以创建 volatile 类型数组,不过只是一个指向数组的引用,而不是整个数组.我的意思是,如果改变引用指向的数组,将会受到 vo ...
HDU 6156 回文数位DP（2017CCPC）
Palindrome Function Time Limit: 8000/4000 MS (Java/Others) Memory Limit: 256000/256000 K (Java/Ot ...
51nod_1459 最短路 dijkstra 特调参数
好多基础知识都没补完,只好看到.用到一个赶紧补全一个,并且保证下次需要的时候直接用,不用回来再补: 其实这个算法是在补同余最短路的时候用到的,当时突然发现理解算法导论上的原理甚至有效性证明,但是就是没 ...
mysql-update时where条件无索引锁全表
1 5.3日数据处理需求 UPDATE md_meter set warranty_end_date = DATE_ADD(warranty_begin_date,INTERVAL 10 ...
P2590 [ZJOI2008]树的统计（LCT）
P2590 [ZJOI2008]树的统计题目描述一棵树上有n个节点,编号分别为1到n,每个节点都有一个权值w. 我们将以下面的形式来要求你对这棵树完成一些操作: I. CHANGE u t : 把 ...

论文笔记《Fully Convolutional Networks for Semantic Segmentation》

论文笔记《Fully Convolutional Networks for Semantic Segmentation》的更多相关文章

随机推荐

热门专题