图像实例分割:CenterMask

CenterMask: single shot instance segmentation with point representation

论文链家:

https://arxiv.org/abs/2004.04446

摘要

本文提出了一种简单、快速、准确的单镜头实例分割方法。单阶段实例分割面临两个主要挑战:对象实例区分和像素级特征对齐。相应地,本文将实例分割分解为两个子任务:局部形状预测(即使在重叠的情况下也可以分离实例)和全局显著性生成(以像素到像素的方式分割整个图像)。两个分支的输出被组合起来形成最终的实例掩码。为了实现这一点,从物体中心点的表示中提取局部形状信息。完全从头开始训练,没有任何铃声和口哨声,提出的中心掩码达到34.5掩码AP,速度为12.3 fps,使用单一模型,在具有挑战性的COCO数据集上进行单尺度训练/测试。除速度慢5倍的TensorMask方法外,该方法的精度高于其他所有一级实例分割方法,说明了中心模板的有效性。此外,该方法还可以方便地嵌入到FCOS等单级目标检测器中,具有良好的性能,体现了中心掩模的通用性。

1.       Introduction

为了解决这些问题,本文建议打破mask表示为两个平行组件:

(1) 一种局部形状表示法,它为每个局部区域预测一个粗略的遮罩,可以自动分离不同的实例。

(2) 一种全局显著性地图,它可以分割整个图像,提供显著性细节,并实现像素级对齐。为了实现这一点,从目标中心的点表示中提取局部形状信息。建模对象作为其中心点是由一级中心网[30]检测器驱动的,因此本文称之为方法中心掩码。建议的中心遮罩的图示如图1所示。给定输入图像,根据关键点估计管道预测目标中心点位置。然后提取中心点的特征表示,形成局部形状,局部形状由一个粗掩模表示,该粗掩模将物体与近距离物体分开。同时,完全卷积的主干线生成了整个图像的全局显著性图,在像素级将前景与背景分离。最后,将粗糙但感知实例的局部形状和精确但不感知实例的全局显著性映射组合起来,形成最终的实例掩码。

为了验证中心掩模的鲁棒性并分析其核心因素的影响,进行了大量的实验,比较了多个基本实例的融合性能。可视化结果表明,仅使用局部形状分支的中心mask可以很好地分离对象,而仅使用全局自性分支的模型在对象不重叠的情况下表现良好。在复杂和对象重叠的情况下,这两个分支的结合可以区分实例,同时实现像素级的分割。COCO[20]测试集图像的中心掩码结果如图2所示。

总之,本文的主要贡献如下:

•提出了一种无锚定盒的一阶段实例分割方法,该方法简单、快速、快速              准确。完全从零开始训练,提出的中心掩模达到34.5掩模AP,速度为12.3 fps对具有挑战性的可可,显示出良好的速度精度权衡。此外,该方法还可以方便地嵌入到FCOS[27]等单级目标检测器中,具有良好的性能,体现了中心掩模的推广性。

•提出对象遮罩的局部形状表示,以区分无锚箱条件下的实例。局部形状分支使用对象中心点的表示,即使在重叠的情况下,也能有效地预测粗糙遮罩和分离对象。

•提出了全局显著性映射,实现自然的像素级特征对齐。与以前的特征对齐操作(例如分割)不同,该模块更简单、更快、更精确。全局显著性生成的行为类似于语义分割[23],希望这项工作能够激励未来的一阶段全景分割[16]。

2.       Related Work

两段式分割:两段式分割方法,先进行包围盒检测,再对包围盒区域的像素进行分类,得到最终的掩模。

一阶段实例分割:目前最先进的一阶段实例分割方法大致可以分为两类:基于全局区域的方法和基于局部区域的方法。基于全局区域的方法首先基于整个图像生成中间和共享的特征地图,然后将提取的特征集合起来形成每个实例的最终遮罩。

3.       CenterMask

本文的目标是建立一种单阶段的实例分割方法。一个阶段意味着没有预先定义的兴趣区域(roi)用于掩模预测,这需要同时定位、分类和分割对象。为了实现这一点,本文将实例分割分解为两个简单且并行的子任务,并将它们的结果集合起来形成最终的掩码。第一个分支从每个对象的中心点表示预测粗糙形状,这可以约束每个对象的局部区域并自然区分实例。

第二个分支预测整个图像的显著性图,实现精确分割并保留精确的空间位置。最后,通过将两个分支的输出相乘来构造每个实例的掩码。

4.       Experiments

在MS-COCO实例分割基准上对所提出的中心掩码的性能进行了评估[20]。该模型在115k个trainval 35k图像上进行训练,并在5k个minival图像上进行测试。最终结果在20k测试设备上进行评估。

5.       Conclusion

本文提出了一种简单、快速、准确的单镜头锚箱自由实例分割方法。将掩模预测分解为两个关键模块:有效分离不同实例的局部形状分支和明智地实现精确分割像素的全局显著分支。大量的融合实验和可视化图像证明了该中心掩模的有效性。本文希望本文的工作能够帮助简化更多的实例级识别任务。

图像实例分割:CenterMask的更多相关文章

  1. CVPR2019 | 超越Mask R-CNN!华科开源图像实例分割新方法MS R-CNN

    安妮 乾明 发自 凹非寺 本文转载自量子位(QbitAI) 实习生又立功了! 这一次,亮出好成绩的实习生来自地平线,是一名华中科技大学的硕士生. 他作为第一作者完成的研究Mask Scoring R- ...

  2. 手把手教你使用LabVIEW实现Mask R-CNN图像实例分割

    前言 前面给大家介绍了使用LabVIEW工具包实现图像分类,目标检测,今天我们来看一下如何使用LabVIEW实现Mask R-CNN图像实例分割. 一.什么是图像实例分割? 图像实例分割(Instan ...

  3. Tensorflow实现Mask R-CNN实例分割通用框架,检测,分割和特征点定位一次搞定(多图)

    Mask R-CNN实例分割通用框架,检测,分割和特征点定位一次搞定(多图)   导语:Mask R-CNN是Faster R-CNN的扩展形式,能够有效地检测图像中的目标,同时还能为每个实例生成一个 ...

  4. 实例分割:MaskXRCnn 与Visual Genome数据集

    一.VG数据集 机器学习领域的突破突然让计算机获得了以未曾有的高精度识别图像中物体的能力--几乎达到了让人惊恐的程度.现在的问题是机器是否还能更上层楼,学会理解这些图片中所发生的事件. Visual ...

  5. 基于FCN的图像语义分割

    语义图像分割的目标在于标记图片中每一个像素,并将每一个像素与其表示的类别对应起来.因为会预测图像中的每一个像素,所以一般将这样的任务称为密集预测.(相对地,实例分割模型是另一种不同的模型,该模型可以区 ...

  6. Deep Snake : 基于轮廓调整的SOTA实例分割方法,速度32.3fps | CVPR 2020

    论文提出基于轮廓的实例分割方法Deep snake,轮廓调整是个很不错的方向,引入循环卷积,不仅提升了性能还减少了计算量,保持了实时性,但是Deep snake的大体结构不够优雅,应该还有一些工作可以 ...

  7. 经典论文系列| 实例分割中的新范式-SOLO

    前言: 这是实例分割中的一篇经典论文,以往的实例分割模型都比较复杂,这篇论文提出了一个简单且直接的实例分割模型,如何设计这种简单直接的模型且要达到一定的精度往往会存在一些困难,论文中有很多思路或思想值 ...

  8. CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)

    CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)1. 目标检测:FCOS(CVPR 2019)目标检测算法FCOS(FCOS: ...

  9. CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等

    CVPR 2020几篇论文内容点评:目标检测跟踪,人脸表情识别,姿态估计,实例分割等 CVPR 2020中选论文放榜后,最新开源项目合集也来了. 本届CPVR共接收6656篇论文,中选1470篇,&q ...

随机推荐

  1. 【Nginx(五)】Nginx配置Https证书

    大致的流程如下 1.申请Https证书,绑定域名信息; 由于自己的服务器是腾讯云服务器, 这里就在腾讯云上申请SSL证书, 申请地址: https://console.cloud.tencent.co ...

  2. 百度sitemap.xml

    <?xml version="1.0" encoding="UTF-8" ?> <urlset xmlns="http://www. ...

  3. 手动脱ORiEN壳实战

    作者:Fly2015 ORiEN这种壳之前没有接触,到底是压缩壳还是加密壳也不知道,只能试一试喽.需要脱壳的程序是吾爱破解脱壳练习第7期的题目. 首先对加壳程序进行查壳,这一步也是程序脱壳的必要的一步 ...

  4. hdu3768 spfa+全排列

    题意:       给你一个无向图,和一些必须经过的点,问你从起点出发,到达所有必须经过的点再回来的最小总路径. 思路:       因为必须经过的点的数量很小,小于等于10,全排列是 10! = 3 ...

  5. 常见设备/CMS弱口令

    目录 tomcat Apache axis2 Apache ActiveMQ zabbix RabbitMQ zentao

  6. Day008 下标越界及小结

    数组的四个基本特点 其长度是确定的.数组一旦被创建,它的大小就是不可以改变的. 其元素必须是相同类型,不允许出现混合类型. 数组中的元素可以是任何数据类型,包括基本类型和引用类型. 数组变量属于引用类 ...

  7. 软件测试中的测试用例Test Case原来是这么回事!

    如果你去找一份功能测试的工作,在软件测试工程师面试过程中,有一些面试官会来一两个非常简单的问题 什么是Test Case?你是如何去写Test Case的? 我们先来看一下测试用例的介绍 什么是测试用 ...

  8. JVM垃圾回收的三种方式

    * 垃圾回收有三种方式 * 一.清除:将需要回收对象的内存空间存放在内存列表中,当需要为新对象分配内存的时候,就会从内存列表中拿取空间分配.不过这种分配方式有两个缺点 * 第一个缺点是内存空间碎片化, ...

  9. C++逆向分析----虚函数与多层继承

    虚函数 C++通过关键字virtual来将函数声明为一个虚函数.当一个类包含虚函数后编译器就会给类的实例对象增加一个虚表指针,所谓的虚表指针就是指向虚表的指针.虚表就是一张地址表,它包含了这个类中所有 ...

  10. 有哪些适合中小企业使用的PaaS平台?

    对于中小企业来说,在业务上同样需要工作流.应用平台来进行支持,但是,面对诸如ERP等动辄好几十万的费用来说,完全是在增加运营成本.如何解决中小企业对于业务应用.工作流管理的需求问题呢?使用PaaS低代 ...