数据标记系列——图像分割 & Curve-GCN

在之前的文章中（参考：），我们提到了Polygon-RNN++在数据标注中的应用。今天不得不提到多伦多大学与英伟达联合公布的一项最新研究：Curve-GCN的应用结果显示图像标注速度提升10倍。

Curve-GCN是一种高效交互式图像标注方法，其性能优于Polygon-RNN++。在自动模式下运行时间为29.3ms，在交互模式下运行时间为2.6ms，比Polygon-RNN ++分别快10倍和100倍。

数据标注是人工智能产业的基础，在机器的世界里，图像与语音、视频等一样，是数据的一个种类。

对象实例分割是在图像中概括给定类的所有对象的问题，这一任务在过去几年受到了越来越多的关注，传统标记工具通常需要人工先在图片上点击光标描记物体边缘来进行标记。

然而，手动跟踪对象边界是一个费力的过程，每个对象大概需要30-60秒的时间。

为了缓解这个问题，已经提出了许多交互式图像分割技术，其通过重要因素加速注释。但是交互式分割方法大多是逐像素的（比如DEXTR），在颜色均匀的区域很难控制，所以最坏的情况下仍然需要很多点击。

Polygon-RNN将humans-in-the-loop（人机回圈）过程进行构架，在此过程中模型按顺序预测多边形的顶点。通过纠正错误的顶点，注释器可以在发生错误时进行干预。该模型通过调整校正来继续其预测。Polygon-RNN显示在人类协议水平上产生注释，每个对象实例只需点击几下。这里最糟糕的情况是多边形顶点的数量，大多数对象的范围最多为30-40个点。

然而，模型的重复性将可扩展性限制为更复杂的形状，导致更难的训练和更长的推理。此外，期望注释器按顺序纠正错误，这在实践中通常是具有挑战性的。

最新研究成果中，研究人员将对象注释框架化为回归问题，其中所有顶点的位置被同时预测。

在Curve-GCN中，注释器会选择一个对象,然后选择多边形或样条轮廓。

Curve-GCN自动地勾勒出对象的轮廓：

Curve-GCN允许交互式更正,并且可以自动重新预测多边形/样条

与Polygon-RNN + +相比：

Curve-GCN具有多边形或样条曲线参数
Curve-GCN可同时预测控制点（更快）

代码：

https://github.com/fidler-lab/curve-gcn

论文地址：

https://arxiv.org/abs/1903.06874

论文摘要

通过边界跟踪来手动标记对象是一个繁重的过程。在Polygon-RNN ++中，作者提出了Polygon-RNN，它使用CNN-RNN架构以循环方式产生多边形注释，允许通过humans-in-the-loop（人机回圈）的方式进行交互式校正。

我们提出了一个新的框架，通过使用图形卷积网络（GCN）同时预测所有顶点，减轻了Polygon-RNN的时序性。我们的模型是端到端训练的。它支持多边形或样条对对象进行标注，从而提高了基于线和曲线对象的标注效率。结果表明，在自动模式下，Curve-GCN的性能优于现有的所有方法，包括功能强大的PSP-DeepLab，并且在交互模式下，Curve-GCN的效率明显高于Polygon-RNN++。我们的模型在自动模式下运行29.3ms，在交互模式下运行2.6ms，比Polygon-RNN ++分别快10倍和100倍。

参考：

多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

数据标记系列——图像分割 & Curve-GCN的更多相关文章

数据标记系列——图像分割 & PolygonRNN++（一）
当前大多数图像语义分割算法都是基于深度学习的方式,但是深度学习的效果很大程度上是依赖于大量训练数据的.目前的图像分割方法无非两种,一种是通过标注人员手动标注,如Cityscapes(提供无人驾驶环境下 ...
数据标记系列——图像分割 & PolygonRNN++（二）
实践 1.export PATH=~/anaconda3/bin:$PATH 2.Anaconda3 中创建新环境 Conda create –name=labelme_polyrnn_pp pyth ...
数据标记系列——标记工具Imagtagger
https://github.com/bit-bots/imagetagger 待有空说一说!
Java 数据持久化系列之池化技术
在上一篇文章<Java 数据持久化系列之JDBC>中,我们了解到使用 JDBC 创建 Connection 可以执行对应的SQL,但是创建 Connection 会消耗很多资源,所以 Ja ...
C# 数据操作系列 - 6 EF Core 配置映射关系
0. 前言在<C# 数据操作系列 - 5. EF Core 入门>篇中,我们简单的通过两个类演示了一下EF增删改查等功能.细心的小伙伴可能看了生成的DDL SQL 语句,在里面发现了些端 ...
C# 数据操作系列 - 8. EF Core的增删改查
0.前言到目前为止,我们看了一下如何声明EF Core的初步使用,也整体的看了下EF Core的映射关系配置以及导航属性的配置. 这一篇,我带大家分享一下,我在工作中需要的EF Core的用法. 1 ...
C# 数据操作系列 - 16 SqlSugar 完结篇
0. 前言前一篇我们详细的介绍了SqlSugar的增删改查,那些已经满足我们在日常工程开发中的使用了.但是还有一点点在开发中并不常用,但是却非常有用的方法.接下来让我们一起来看看还有哪些有意思的内容 ...
C# 数据操作系列 - 19 FreeSql 入坑介绍
0. 前言前几天FreeSql的作者向我推荐了FreeSql框架,想让我帮忙写个文章介绍一下.嗯,想不到我也能带个货了.哈哈,开个玩笑-看了下觉得设计的挺有意思的,所以就谢了这篇文章. 简单介绍一下 ...
Tapdata 肖贝贝：实时数据引擎系列(四)-关于 Oracle 与 Oracle CDC
摘要:想实现 Oracle 的 CDC,排除掉一些通用的比如全量比对, 标记字段获取之外, 真正的增量形式获取变更, 有三种办法: Logminer .XStream .裸日志解析,但不管哪种方法 ...

随机推荐

【JS】基础知识
引言在互联网的演化过程中,网页制作是Web1.0时代的产物,那时网站的主要内容都是静态的,用户使用网站的行为也以浏览为主. 2005年以后,互联网进入了Web2.0时代,各类似桌面软件的Web应用大 ...
Linux下的Memcache安装和安装Memcache的PHP扩展
一.首先安装服务端memcached 1.下载libevent与memcache软件包. 下载memcached: wget http://memcached.org/latestwget http: ...
GDB十分钟教程【转载于网络爱好者】
本文写给主要工作在Windows操作系统下而又需要开发一些跨平台软件的程序员朋友,以及程序爱好者. GDB是一个由GNU开源组织发布的.UNIX/LINUX操作系统下的.基于命令行的.功能强大的程序调 ...
[HAOI2015][bzoj 4033]树上染色（树dp+复杂度分析）
[题目描述]有一棵点数为N的树,树边有边权.给你一个在0~N之内的正整数K,你要在这棵树中选择K个点,将其染成黑色,并将其他的N-K个点染成白色.将所有点染色后,你会获得黑点两两之间的距离加上白点两两 ...
Processing 2.1.1 无法使用video和movie问题解决方案
升级到2.1.1后,尝试着运行了一下sample中的video和movie,结果都报错,上网搜了一下,找到解决方法. 1. 首先来看movie的错误,如下: JNA: Callback org.gst ...
（21）打鸡儿教你Vue.js
组件化思想: 组件化实现功能模块的复用高执行效率开发单页面复杂应用组件状态管理(vuex) 多组件的混合使用 vue-router 代码规范 vue-router <template> ...
项目发布到tomcat后，通过项目名称访问报404
查看tomcat发布地址发现和项目名称不一致如果直接拷贝项目,可能也需要修改此选项解决方案: 经过排查发现了原因: 首先说明一下项目 Maven+SSM 需要使用到 maven tomcat 7 ...
[CTF]CTF中if (md5(md5($_GET[‘a’])) == md5($_GET[‘b’])) 的绕过
原作者:KTWO 出处:https://www.k2zone.cn/?p=2019 0X00 摘要 CTF中md5判等可使用0e绕过,但是如果是双md5该如何绕过呢?本文将教你如何绕过md5(md5( ...
el-select定义初始值并且可以修改
[](https://img2018.cnblogs.com/blog/1338470/201811/1338470-20181112152013318-1731627947.png <el-f ...
ACL终极详解

数据标记系列——图像分割 & Curve-GCN

数据标记系列——图像分割 & Curve-GCN的更多相关文章

随机推荐

热门专题