创新点: 1.在GCN(global convolutional network)基础上,把他的backbone替换成更多层的,使其适应中分辨率影像,resnet50,101,152 2.利用 channel attention 来挑选出最具有识别力的特征 3.迁移学习来解决数据稀缺的问题,用了不同分辨率训练好的数据 目标数据集: landsat-8 和 ISPRS Vaihingen Challenge Dataset 语义分割现代技术: 1.global context(全局上下文信息):如…
作者认为语义分割的两个挑战是分类和定位,而这两个挑战又是比较对立的.对于分类问题,模型需要有变形和旋转不变形,而对于定位问题,模型有需要对变形敏感. 提出的GCN遵循两个主要原则: 1.对定位问题,模型需要全卷积来获得定位信息,不能有全连接或是全局池化层. 2.对分类问题,需要有大的卷积核来连接特征图和每个像素的分类器 此外还添加了边界精细块(boundary refinement block)来代替传统的CRF后处理 全局卷积时没有用非线性激活函数,只有卷积层 1*k+k*1的效果比 k*k…
In this post, I review the literature on semantic segmentation. Most research on semantic segmentation use natural/real world image datasets. Although the results are not directly applicable to medical images, I review these papers because research o…
1.介绍 语义分割通常有两个问题:类内不一致性(同一物体分成两类)和类间不确定性(不同物体分成同一类).本文从宏观角度,认为语义分割不是标记像素而是标记一个整体,提出了两个结构解决这两个问题,平滑网络和边界网络(Smooth Network and Border Network).平滑网络用的是通道注意力块(Channel Attention Block),来解决类内不一致性.边界网络集成了语义边界损失. 2.相关工作 Encoder-Decoder:主要考虑如何恢复由于池化造成的空间信息损失,…
摘要 卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有效的推理和学习产生相应尺寸的输出.我们定义并指定全卷积网络的空间,解释它们在空间范围内dense prediction任务(预测每个像素所属的类别)和获取与先验模型联系的应用.我们改编当前的分类网络(AlexNet [22] ,the VGG net [34] , and GoogLeNet [35] )到完…
Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation xx…
Instance-aware Semantic Segmentation via Multi-task Network Cascades Jifeng Dai Kaiming He Jian Sun 本文的出发点是做Instance-aware Semantic Segmentation,但是为了做好这个,作者将其分为三个子任务来做: 1) Differentiating instances. 实例区分 2) Estimating masks. 掩膜估计 3) Categorizing obje…
Rich feature hierarchies for accurate object detection and semantic segmentation 作者: Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik 引用: Girshick, Ross, et al. "Rich feature hierarchies for accurate object detection and semantic segmentation…
发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量.以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述(概率),比如AlexNet的ImageNet模型输出一个1000维的…
论文题目是STC,即Simple to Complex的一个框架,使用弱标签(image label)来解决密集估计(语义分割)问题. 2014年末以来,半监督的语义分割层出不穷,究其原因还是因为pixel级别的GroundTruth太难标注,因此弱监督成了人们研究的一个热门方向. 作者的核心思想是提出了层层递进的三个DCNN. 具体来讲,作者一共训练了三个网络:Initial DCNN.Enhanced DCNN和Powerful DCNN.分别解释如下: 1 . Initial DCNN:…