论文笔记（9）：Multiscale Combinatorial Grouping

本文大致脉络：

对每张图片，作者首先使用 P. Doll´ar and C. Zitnick. Structured forests for fast edge detection. ICCV , 2013. 4, 5 来产生边缘图（edge probability map)，请注意probability，因为下面connected regions 之间的 similarity 就是通过这个probability 来体现的，这里的probability 指的是该点的像素属于边缘的概率。对边缘图进行watershed得到轮廓图，通过对轮廓图进行一系列操作得到UCM图，如下图：

在UCM图里，黑色区域部分可以认为是connected regions，该图通过白色部分分离开来，白色部分的每个像素都是一个实值(0-1)，图中每条边的一小段的像素值都是相同的，该值表示该边所连接区域的不相似度，值越小，这两个区域越有可能合并称为一个区域。利用UCM图，获取图像的superpixels，也就是一个个connected regions ，任意两个相邻的 regions 之间都有一个不相似度值。

接下来就是要对这所有的N个regions hierarchically 合并了，方法就是将N个叶子节点两两合并，最终得到 N-1个非叶子节点，这样就构造了一颗完全二叉树，二叉树的根部是整个图像区域，叶子节点就是一开始得到的 superpixels。这样一张UCM图可以得到一个 hierarchical segmentation。这里的初始的superpixels和组合后的非叶子节点都可以看做是一个proposals，这样一共是2N-1个proposals。

得到该树后，作者从二叉树离获取 4个list 的proposals。分别是 singleton, pairs, triplets ,fours。在获取的时候使用了Pareto optimization，看着挺高深，其实就是 4个整数值，我们以这样的一个组合为例(700,2000,3000,2000)。700对应于 singleton，表示从二叉树中从顶向下取前700个proposals。对于二叉树的非根节点来说，每个节点都有父母，每个父母都有自己的兄弟，那么每个节点都有一个叔叔，pairs就表示叔叔与侄子的组合，比如说4个节点 1、2、3、4，1和2 组成了5,3和4组成了6，那么5就是1和2 的父节点，6是3和4的父节点，5是3和4的叔叔，那么在pairs里5、3可以是一种组合，一种新的proposals，2000表示从这所有的叔叔-侄子组合中，自顶向下去2000个这样的组着，那么triplets中的3000就表示侄子-叔叔-叔叔的叔叔的3000中组合，同理fours. 这样对每张UCM图，会到一个一个bottom-up组合，然后从该组合中可以得到4个list的proposals。

在作者的代码中实际上是对原来的图片进行scale （2,1,0.5）,这样一共可以得到3张UCM图，然后将三张UCM图融合，这样一共有四种UCM图，每种UCM都可以得到4个list的proposals，一共有16个lists的proposals，作者收集zhexieproposals，然后对他们进行 overlap>0.95的筛选。然后再进行hole-filling，因为在之前的组合中可能某种proposals会有明显的hole inside。

最后，在得到一个完整的proposals set后，作者提取每个proposals 的面积、周长、边界强度等2D基本特征，用这些特征组成向量来表示该proposal，然后训练随机森林回归器来对这些proposals排名。

作者提供了两个版本的UCM，Fast UCM 和Accurate UCM正如图所示， Fast UCM 最终会得到4个list的proposals， Accurate 会得到16个list的 proposals。

最后附上MCG简易流程图：

论文笔记（9）：Multiscale Combinatorial Grouping的更多相关文章

Multiscale Combinatorial Grouping 学习和理解源代码(一)
目标探测由于所做的最新研究.因此,这一领域的一般阅读文章.发现这篇文章,效果是比较新的比较好.在如此仔细研究.贴纸和共享.下面已经发布若干个连续的,分别对论文和代码进行大致地介绍,最后依据自己的实验对 ...
Video Frame Synthesis using Deep Voxel Flow 论文笔记
Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...
论文笔记：CNN经典结构1（AlexNet，ZFNet，OverFeat，VGG，GoogleNet，ResNet）
前言本文主要介绍2012-2015年的一些经典CNN结构,从AlexNet,ZFNet,OverFeat到VGG,GoogleNetv1-v4,ResNetv1-v2. 在论文笔记:CNN经典结构2 ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
Deep Learning论文笔记之（六）Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
Multimodal —— 看图说话（Image Caption）任务的论文笔记（一）评价指标和NIC模型
看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.这项任务要求模型可以识别图 ...

随机推荐

[poj3565]Ants
[poj3565]Ants 标签(空格分隔):二分图描述 Young naturalist Bill studies ants in school. His ants feed on plant-l ...
hibernate的事务管理和session对象的详解
//开启事务 transaction=session.beginTransaction(); 上面为开启事务 transaction.commit();这个为提交事务从session对象中获取事务后 ...
hihoCoder 树结构判定（并查集）
思路:树满足两个条件: 1.顶点数等于边数加一 2.所有的顶点在一个联通块那么直接dfs或者并查集就可以了. AC代码 #include <stdio.h> #include<st ...
mysql常用脚本及命令记录
mysql导出用户权限 mysql中直接通过授权即可使用对应用户,不必使用创建用户命令(如CREATE USER 'xxx'@'%' IDENTIFIED BY 'XXX';)先建用户再授权. 方法一 ...
使用dlib中的深度残差网络(ResNet)实现实时人脸识别
opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好,本文使用dlib中提供的人脸检测方法(使用HOG特征或卷积神经网方法),并使用提供的深度残差网络(ResNet)实现实时人脸识别 ...
4.1 PCIe总线的基础知识
与PCI总线不同,PCIe总线使用端到端的连接方式,在一条PCIe链路的两端只能各连接一个设备,这两个设备互为是数据发送端和数据接收端.PCIe总线除了总线链路外,还具有多个层次,发送端发送数据时将通 ...
R︱Linux+Rstudio Server尝鲜笔记（打造最佳Rstudio体验+报错的解决方案）
Rstudio Server 是Rstudio开发的基于R语言的网页版(只能在Linux),你在手机上都可以运行R,还是挺方便的.就是配置起来有点麻烦. 官方下载链接:https://www ...
dojo中的dojox/grid/EnhancedGrid表格报错
1.错误截图 2.错误出处 <body class="claro"> <div id="gridContainer"> <span ...
HighCharts之2D柱状图、折线图的组合双轴图
HighCharts之2D柱状图.折线图的组合双轴图 1.实例源码 DoubleAxis.html: <!DOCTYPE html> <html> <head> & ...
【mongodb系统学习之十一】mongodb删除数据
十一.mongodb删除数据: 1).删除全部文档:remove,语法db.collectionName.remove({}):小括号里边必须要有条件,否则不成功:如果只是一个空的{},则会删除集合内 ...

论文笔记（9）：Multiscale Combinatorial Grouping

论文笔记（9）：Multiscale Combinatorial Grouping的更多相关文章

随机推荐

热门专题