语义分割Semantic Segmentation研究综述

语义分割和实例分割概念

语义分割：对图像中的每个像素都划分出对应的类别，实现像素级别的分类。

实例分割：目标是进行像素级别的分类，而且在具体类别的基础上区别不同的实例。

语义分割（Semantic Segmentation）

输入：一张原始的RGB图像

输出：带有各像素类别标签的与输入同分辨率的分割图像

对预测的分类目标采用one-hot编码，为每个分类类别创建一个输出的channel。

将分割图相加到原始图像上的效果。

语义分割的难点

在经典的网络中，需要经过多层卷积和池化进行提取特征工作，从而找到分类目标，这个过程会使图像尺寸逐渐减小。需要将分类后的特征图还原到原图尺寸。

通常的做法是编码和解码网络结构。

卷积核池化操作可以看图像编码的过程，也就是下采样过程。

解码理解为编码的逆运算，对输出的特征图不断上采样，逐渐得到一个与原始图像同分辨率的分割图。

卷积动图

最大池化和最大池化的示意图（池化上采样是通过将单个值分配更高的分辨率来达到扩充的目的）

反卷积（转置卷积）

Dilated convolution(空洞卷积)

1. FCN全卷积网络简介

1.1 关键技术：卷积化（convolutionalization)

分类所使用的网络通常会在最后连接全连接层，它会将原来二维的矩阵(图片)压缩成一维的，从而丢失了空间信息，最后训练输出一个标量，这就是我们的分类标签。

语义分割的输出是个分割图，至少是二维的。通常是一个类别为一个通道。

1.2 关键技术：上采样(Upsampling)

需要得到一个与原图像size相同的分割图，需要对最后一层进行上采样。

1.3 关键技术：跳跃结构(Skip Architecture)

由于直接将全卷积的结果上采样后的结果很粗糙。采用跳跃结构，将不同池化层的结果进行上采样，然后结合这些结果来优化输出。（出发点：由于池化层会丢失信息，将不同池化层结果上采样，从而弥补部分信息）

2. u-net简介

u-net作为FCN的改进，通过扩大网络解码器容量来改进了全卷积网络结构，并给编码和解码模块添加了收缩路径（contracting path），从而实现更精准的像素边界定位。

融合之前要crop到对应的层相同尺寸。（思考：融合操作是不是对应通道的相加，具体需要看论文和代码。有没有更合理的特征融合方法）

3. v-net简介

v-net 可以理解为 3D 版本的 u-net ，适用于三维结构的医学影像分割。v-net 能够实现 3D 图像端到端的图像语义分割，加了一些像残差学习一样的trick来进行网络改进，总体结构上与 u-net 差异不大。

语义分割Semantic Segmentation研究综述的更多相关文章

语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet，语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类；目标检测只有两类,目标和非目标，就是在一张图片中找到并用box标注出所有的目标.
from:https://blog.csdn.net/u012931582/article/details/70314859 2017年04月21日 14:54:10 阅读数:4369 前言在这里, ...
自动网络搜索（NAS）在语义分割上的应用（二）
前言: 本文将介绍如何基于ProxylessNAS搜索semantic segmentation模型,最终搜索得到的模型结构可在CPU上达到36 fps的测试结果,展示自动网络搜索(NAS)在语义分割 ...
【Semantic segmentation】Fully Convolutional Networks for Semantic Segmentation 论文解析
目录 0. 论文链接 1. 概述 2. Adapting classifiers for dense prediction 3. upsampling 3.1 Shift-and-stitch 3.2 ...
FCN与U-Net语义分割算法
FCN与U-Net语义分割算法图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环,也是 AI 领域中一个重要的分支.语义分割即是对图像中每一 ...
[转]综述论文翻译：A Review on Deep Learning Techniques Applied to Semantic Segmentation
近期主要在学习语义分割相关方法,计划将arXiv上的这篇综述好好翻译下,目前已完成了一部分,但仅仅是尊重原文的直译,后续将继续完成剩余的部分,并对文中提及的多个方法给出自己的理解. _论文地址:htt ...
综述论文翻译：A Review on Deep Learning Techniques Applied to Semantic Segmentation
近期主要在学习语义分割相关方法,计划将arXiv上的这篇综述好好翻译下,目前已完成了一部分,但仅仅是尊重原文的直译,后续将继续完成剩余的部分,并对文中提及的多个方法给出自己的理解. 论文地址:http ...
语义分割的简单指南 A Simple Guide to Semantic Segmentation
语义分割是将标签分配给图像中的每个像素的过程.这与分类形成鲜明对比,其中单个标签被分配给整个图片.语义分段将同一类的多个对象视为单个实体.另一方面,实例分段将同一类的多个对象视为不同的单个对象(或实例 ...
CVPR2020论文解读：三维语义分割3D Semantic Segmentation
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3 ...
[论文][半监督语义分割]Adversarial Learning for Semi-Supervised Semantic Segmentation
Adversarial Learning for Semi-Supervised Semantic Segmentation 论文原文摘要创新点:我们提出了一种使用对抗网络进行半监督语义分割的方法 ...

随机推荐

eclipse 配置动态web项目在servers中运行
第一步: window->preferences:Server->Runtime Environments窗口,add. 第二步: window->preferences:Proje ...
2018.07.03 POJ 2653 Pick-up sticks（简单计算几何）
Pick-up sticks Time Limit: 3000MS Memory Limit: 65536K Description Stan has n sticks of various leng ...
2018.08.04 spoj TTM to the moon（主席树）
spoj传送门 vjudge传送门主席树板子题. 支持历史版本的区间和,区间和,区间修改和时光倒流. 其中新奇一点的也只有区间修改了,这个东西直接标记永久化就行了. 如果想下传标记的话也行,需要在p ...
34.More-healthyful Menu Options for Kids 给孩子提供的更健康菜式选择
34.More-healthyful Menu Options for Kids 给孩子提供的更健康菜式选择 ① French fries,washed down with a pint of sod ...
深入浅析JavaScript中with语句的理解
JavaScript 有个 with 关键字, with 语句的原本用意是为逐级的对象访问提供命名空间式的速写方式. 也就是在指定的代码区域, 直接通过节点名称调用对象. with语句的作用是暂时改变 ...
继承方法-->原型的相互引用
function Father(){} Father.prototype.name = 'zhang'; function Son(){} function inherit(Target,Orgin) ...
记录：Web相关政策之备案号、视频播放
(一)备案号链接: 服务器在国内的网站受工信部监管,并受其颁布的<管理办法>约束.根据<互联网信息服务管理办法>及<非经营性互联网信息服务备案管理办法>的法律法规, ...
高博-《视觉SLAM十四讲》
0 讲座 (1)SLAM定义对比雷达传感器和视觉传感器的优缺点(主要介绍视觉SLAM) 单目:不知道尺度信息双目:知道尺度信息,但测量范围根据预定的基线相关 RGBD:知道深度信息,但是深度信息对 ...
SSH:Struts + Spring + Hibernate 轻量级Java EE企业框架
Java EE(Java Platform,Enterprise Edition)是sun公司(2009年4月20日甲骨文将其收购)推出的企业级应用程序版本.这个版本以前称为 J2EE.能够帮助我们开 ...
MySQL性能调优与架构设计——第 15 章可扩展性设计之Cache与Search的利用
第 15 章可扩展性设计之Cache与Search的利用前言: 前面章节部分所分析的可扩展架构方案,基本上都是围绕在数据库自身来进行的,这样是否会使我们在寻求扩展性之路的思维受到“禁锢”,无法更为 ...