论文笔记《Fully Convolutional Networks for Semantic Segmentation》

一、Abstract

提出了一种end-to-end的做semantic segmentation的方法，也就是FCN，是我个人觉得非常厉害的一个方法。

二、亮点

1、提出了全卷积网络的概念，将Alexnet这种的最后的全连接层转换为卷积层，好处就是可以输入任意的scale。

只不过在输出的scale不同的时候，feature map的大小也不同，因为这里的目的是最piexl的语义分割，所以其实不重要。

在Alexnet基础上, 最后的channel=4096的feature map经过一个1x1的卷积层, 变为channel=21的feature map, 然后经过上采样和crop, 变为与输入图像同样大小的channel=21的feature map, 也就是图中的pixel-wise prediction。在Longjon的试验中一共有20个语义类别, 加上背景类别每个像素应该有21个softmax预测类, 因此pixel-wise prediction中channel=21。

2、如何做上采样的？

对CNN的输出结果进行upsampling，上采样的参数是可学习的，这里采用的方法是反卷积，其实跟BP的求卷积层的梯度是一样的算法，最后得到一个和原图一样大小的输出，输出结果为对每个像素的分类。

3、如何把全连接层转换为卷积层？

这篇博文写的很好http://blog.csdn.net/u010668083/article/details/46650877，这里有一个概念我之前一直模糊了，把全连接层转换为卷积层，实际上是用一个和输入的图像一样大小的卷积核去做这个操作。对于一个7*7*512的cov输出，连接到一个1*1*4096的全连接层，转换的方法也就是：用4096组滤波器，每组滤波器有512组，每组的大小是7*7的（所以我的理解就是..这个滤波器的大小实际上是7*7*512），这样的话，参数数量一致，最后的输出也是一致的。在输出变大的时候，因为是都是卷积层，最后当然可以得到一个上面那张图的输出。

4.refinement

作者发现，直接这样做效果并不是很好，于是拿出了祖传trick来解决问题了。

如下图所示，在最后upsampling的时候，不只用最后一层，还要结合前面几层一起来做一个fusion，这个很好理解，前面几层的感受野是比较小的，所以在局部的输出结果上是不错的，而后面的输出感受野是越来越大的，可以说准确率会高一点，进行融合以后，效果好的飞起..

三、结论

语义分割方面FCN可以说是开了一个山头了，我觉得这个想法很好，对于之后的instance segmentation也有很大的帮助。

论文笔记《Fully Convolutional Networks for Semantic Segmentation》的更多相关文章

《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
[place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析（转）
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果用5G的计算量和25M的参数. ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
论文笔记：ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
论文笔记：DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
论文笔记：Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
论文笔记：Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

SpringBoot学习记录(二)
一. SpringBoot日志框架 SpringBoot:底层是Spring框架,Spring框架默认是用JCL(commons-logging): SpringBoot选用SLF4j和logback ...
winform下读取excel文件并绑定datagridview例子
首先我要读取这个excel文件然后生成Datable 用winform编程的方式前台界面: 后台的代码 using System; using System.Collections.Generic; ...
Bootstrap 历练实例-轮播(carousel)插件的事件
事件下表列出了轮播(Carousel)插件中要用到的事件.这些事件可在函数中当钩子使用. 事件描述实例 slide.bs.carousel 当调用 slide 实例方法时立即触发该事件. $(' ...
SpringBoot学习2：springboot整合servlet
整合方式1:通过注解扫描完成 Servlet 组件的注册 1.编写servlet package com.bjsxt.servlet; import javax.servlet.ServletExce ...
jquery简易的三级导航
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> ...
Docker容器学习--1
Docker是PaaS 提供商 dotCloud 开源的一个基于 LXC 的高级容器引擎,源代码托管在 Github 上, 基于go语言并遵从Apache2.0协议开源.Docker是通过内核虚拟化技 ...
初学puppet
初学puppet puppet是什么? puppet是一个开源的软件自动化配置和部署工具,很多大型IT公司均在使用puppet对集群中的软件进行管理和部署. Puppet简介 Puppet的目录是让管 ...
PHP代码中出现中文乱码怎么办？
header("Content-type:text/html;charset=utf-8"); //加上这个就OK //示例 : class WechatController ex ...
学习Pytbon第三天，用户输入
_username ='dream' #定义用户名 _password ='dream123'#定义用户密码username = input("username:")#请输入用户名 ...
c++ string vector类
//string对象的初始化 #include <iostream> #include <string> //typedef std::basic_string<char ...

论文笔记《Fully Convolutional Networks for Semantic Segmentation》

论文笔记《Fully Convolutional Networks for Semantic Segmentation》的更多相关文章

随机推荐

热门专题