一、内容

Step 0：首先使用数据集（完全不包含 Unseen Classes 的图片）训练 DeepLabv3+ 模型，得到的模型可以对只含有 Seen Classes 的图片进行分类，去掉训练好的 DeepLabv3+ 的最后一层分类层，将其变成一个特征提取器。将所有 Classes 输入到 w2c 模型，得到每个Class 对应的向量，将此向量连接到 ground-truth 中每个像素上，即每个像素都有其对应的类的向量。

Step 1：使用数据集（完全不包含 Unseen Classes 的图片）输入到 DeepLabv3+ 模型，得到特征图，根据 ground-truth 上的 Class 筛选出不同类别的特征，将每个类的特征作为 Label，对应类的 w2c 输出的向量作为输入，训练 GMMN 模型。

Step 2：使用完整数据集（包含 Seen 和 Unseen Classes 的图片）输入到 DeepLabv3+ 模型，如果不包含 Unseen Classes，那么直接拿出特征图去训练最终的分类器，如果包含，则根据图片的 ground-truth 对应的类的向量一一生成特征，将不同类特征组合到一起，再去训练最终的分类器。

二、理解

1. 代码中将 Step 1 和 2 和在了一起，为了便于理解，把 Step 1 和 2 分开解释。

2. Step 2 中使用了两次包含 Unseen Classes 的图像和其 ground-truth。

在逐个对类的词向量生成特征时，用到了 ground-truth，根据 ground-truth 知道了类的总数、每个类的位置、以及对应的词向量。
在最终训练分类器时，也用到了含有 Unseen Class 的图像的 ground-truth。
也可以直接忽略 DeepLab 生成的特征图，直接根据 Seen 和 Unseen 标签随机生成图片，利用类的词向量通过 GMMN 生成特征，结合生成的图片的 Label 去训练最终分类器。

3. w2c 和 GMMN 是文章的关键，w2c 建立了一个从词语到向量的联系，GMMN 建立了一个从词向量到特征图上的视觉特征的联系，比如，使用 Unseen Class 为子弹，Seen Class 中包括弹匣，其他都是些不相干的类，自然子弹和弹匣在词向量中的联系比较起来相对紧密，从而子弹通过 GMMN 生成的特征也更与弹匣类似，通过最终分类器的训练，也就更容易能分辨出子弹。

【论文总结】Zero-Shot Semantic Segmentation的更多相关文章

论文笔记《Feedforward semantic segmentation with zoom-out features》
[论文信息] <Feedforward semantic segmentation with zoom-out features> CVPR 2015 superpixel-level,f ...
【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)
这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...
Semi-supervised semantic segmentation needs strong, varied perturbations
论文阅读: Semi-supervised semantic segmentation needs strong, varied perturbations 作者声明版权声明:本文为博主原创文章,遵 ...
Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）
摘要卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有 ...
论文笔记（3）：STC: A Simple to Complex Framework for Weakly-supervised Semantic Segmentation
论文题目是STC,即Simple to Complex的一个框架,使用弱标签(image label)来解决密集估计(语义分割)问题. 2014年末以来,半监督的语义分割层出不穷,究其原因还是因为pi ...
2018年发表论文阅读：Convolutional Simplex Projection Network for Weakly Supervised Semantic Segmentation
记笔记目的:刻意地.有意地整理其思路,综合对比,以求借鉴.他山之石,可以攻玉. <Convolutional Simplex Projection Network for Weakly Supe ...
论文笔记：Rich feature hierarchies for accurate object detection and semantic segmentation
在上计算机视觉这门课的时候,老师曾经留过一个作业:识别一张 A4 纸上的手写数字.按照传统的做法,这种手写体或者验证码识别的项目,都是按照定位+分割+识别的套路.但凡上网搜一下,就能找到一堆识别的教程 ...
论文阅读笔记二十四：Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(R-CNN CVPR2014)
论文源址:http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要在PASCAL VOC数据集上,最好的方法的思路是将低级信息与较高层次的上下文信息进 ...
论文阅读笔记十七：ReﬁneNet: Multi-Path Reﬁnement Networks for High-Resolution Semantic Segmentation（CVPR2017）
论文源址:https://arxiv.org/abs/1611.06612 tensorflow代码:https://github.com/eragonruan/refinenet-image-seg ...

随机推荐

字符串的展开expand
A. 字符串的展开(expand.cpp) 内存限制:64 MiB 时间限制:1000 ms 标准输入输出题目类型:传统评测方式:文本比较题目描述在初赛普及组的"阅读程序写结果&qu ...
我踩过的Django的坑
把自己在使用Django过程中吃过的亏踩过的坑记录一下 1. unique_together传的是元组正确:unique_together = (('app_id', 'module_id', ...
django中的时区问题
在django中设置时区,通过setting文件中的: TIME_ZONE = 'Asia/Shanghai' 开起多时区支持功能:USE_TZ=True 这时在数据库中插入的时间为UTC时间,当调用 ...
[ css ] 实现漂亮的输入框动画（借鉴自panjiachen的后台管理项目）
效果预览 HTML <div class="l-custom-input"> <input size="large" id="l-i ...
SpringBoot学习笔记一之本地环境基础搭建
原文链接: https://www.toutiao.com/i6802935050196222471/ 工程创建 Maven创建工程搜索maven找到project的创建创建simple proj ...
PPT2010制作翻牌动画
原文: https://www.toutiao.com/i6492653280676545037/ 新建一张空白幻灯片选择"插入"选项卡,"插入"功能组,&q ...
javascript随机变色--案例
1.打开网页,网页效果如图所示代码如下: 1 <!DOCTYPE html> 2 <html> 3 <head> 4 <meta charset=" ...
mysql数据库优化1
目录数据库结构的设计优化 1.数据库结构的设计 2.针对大型的数据量提前进行分库和分表 3.分库分表带来的问题 4.表结构设计注意的问题查询优化 1.查询语句的注意事项 2.应尽量避免在 wher ...
C# 季节判断
编写一个控制台应用程序,可根据输入的月份判断所在季节. 代码如下 using System; using System.Collections.Generic; using System.Linq; ...
manjaro20WPS缺少字体
宋体等 sudo pacman -S ttf-wps-fonts Ariel和Times New Roman https://askubuntu.com/questions/651441/how-to ...

【论文总结】Zero-Shot Semantic Segmentation

一、内容

二、理解

【论文总结】Zero-Shot Semantic Segmentation的更多相关文章

随机推荐

热门专题