Notes on Efficient Graph-Based Image Segmentation

算法的目标

按照一种确定的标准, 将图片分割成细粒度的语义区域, 即Super pixel.

算法步骤

  • 预处理. 将图片转换为undirected graph: \(G(V, E)\):

    • 每一个像素都是一个顶点.
    • 只有相邻像素间才存在边
    • 边的权重为它连接的两个顶点间的像素距离作者的代码使用了欧氏距离
  • Steps:
  1. 将\(E\)按权重递增排序: \(\pi = (e_1, e_2, \dots, e_m)\)
  2. \(S^0 = V\), 即一开始每个顶点都一个单独的region.
  3. 重复4直到处理完所有的边得到\(S^1, S^2, \dots, S^{m - 1}, S^m\):
  4. \(S^q\)由\(S^{q - 1}\)得到:
    • \(e_q = <v_i, v_j>\)
    • 如果: (1) \(v_i, v_j\)不在\(S^{q - 1}\)的同一个连通区域内, 即:\(C_i^{q -1} \neq C_j^{q - 1}\), 且(2)\(e_q\)的权重比两个component内部的像素差异要小, 即:\(w(e_q) < MInt(C_i^{q -1}, C_j^{q - 1})\), 则将\(C_i^{q -1}, C_j^{q - 1}\)在\(S^{q-1}\)内合并.
    • \(S^q = S^{q - 1}\)
  5. Return \(S^m\)

从之前的构图, 到后面的merge, 都是很常规的做法. 算法的关键在于\(MInt(C_i, C_i)\)函数上, 即如何决定是否合并两个相邻像素/相邻区域.

注意, region/区域与component/连通分量在此处含义相同, 可交换使用

Pairwise Region Comparison

具体参考原文Section 3.1

在考虑是否要将两个region合并成一个region时, 需要考虑internal-region的像素差异程度与inter-region的像素差异.

region内部的差异定义为这个region的最小生成树的最大权重:

\[
Int(C) = \max_{e\in MST(C, E)}w(e)
\]

region间的差异定义为连接两个region的最小边的权重:

\[
Dif(C_1, C_2) = \min_{v_i \in C_1, v_j \in C2, <v_i, v_j> \in E} w(<v_i, v_j>)
\]

这个值在上面的算法中为\(w(e_q)\).

\[
MInt(C_1, C_2) = min(Int(C_1) + \tau(C_1), Int(C_2) + \tau(C_2))
\]

其中, \(\tau(C) = \frac {k}{|C|}\). \(k\)是一个指定的常数. \(|C|\)是region的面积(包含的像素个数).

\(Dif(C_1, C_2) < MInt(C_1, C_2)\)是合并\(C_1, C_2\)的前提条件. 之所以加入\(\tau(C)\), 是为了降低小region合并的门槛.

需要设定的参数

  • \(\sigma\): 在分割图片之前需要对其进行高斯平滑操作, 使用期望为0, 方差为\(\sigma^2\)的高斯分布.
  • \(k\): \(\tau = \frac {k}{|C|}\) 里的\(k\), \(k\)越大, 最后分割出的region也偏大
  • \(min_area\): 在初次分割完之后, 会有很多小region, \(min_area\)用于判断小region, 然后将小region合并

Notes on 'Efficient Graph-Based Image Segmentation'的更多相关文章

  1. VIPS: a VIsion based Page Segmentation Algorithm

    VIPS: a VIsion based Page Segmentation Algorithm VIPS: a VIsion based Page Segmentation Algorithm In ...

  2. Graph Based SLAM 基本原理

    作者 | Alex 01 引言 SLAM 基本框架大致分为两大类:基于概率的方法如 EKF, UKF, particle filters 和基于图的方法 .基于图的方法本质上是种优化方法,一个以最小化 ...

  3. 论文解读(GCC)《Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering》

    论文信息 论文标题:Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering论文作者:Chaki ...

  4. 论文阅读笔记五十二:CornerNet-Lite: Efficient Keypoint Based Object Detection(CVPR2019)

    论文原址:https://arxiv.org/pdf/1904.08900.pdf github:https://github.com/princeton-vl/CornerNet-Lite 摘要 基 ...

  5. 论文阅读-Temporal Phenotyping from Longitudinal Electronic Health Records: A Graph Based Framework

  6. Awesome Deep Vision

    Awesome Deep Vision  A curated list of deep learning resources for computer vision, inspired by awes ...

  7. Computer Vision Tutorials from Conferences (3) -- CVPR

    CVPR 2013 (http://www.pamitc.org/cvpr13/tutorials.php) Foundations of Spatial SpectroscopyJames Cogg ...

  8. PP: Extracting statisticla graph features for accurate and efficient time series classification

    Problem: TSC, time series classification; Traditional TSC: find global similarities or local pattern ...

  9. Survey of single-target visual tracking methods based on online learning 翻译

    基于在线学习的单目标跟踪算法调研 摘要 视觉跟踪在计算机视觉和机器人学领域是一个流行和有挑战的话题.由于多种场景下出现的目标外貌和复杂环境变量的改变,先进的跟踪框架就有必要采用在线学习的原理.本论文简 ...

随机推荐

  1. POJ 1696 Space Ant 【极角排序】

    题意:平面上有n个点,一只蚂蚁从最左下角的点出发,只能往逆时针方向走,走过的路线不能交叉,问最多能经过多少个点. 思路:每次都尽量往最外边走,每选取一个点后对剩余的点进行极角排序.(n个点必定能走完, ...

  2. HMAC算法AS3版

    http://www.cnblogs.com/appleseed/archive/2008/09/17/1292232.html

  3. [No000037]操作系统Operating Systems操作系统历史与硬件概况History of OS & Summaries!

    培根:读史使人明智 操作系统的简史 (1955-1965) 计算机非常昂贵,上古神机IBM7094 ,造价在250万美元以上 计算机使用原则:只专注于计算 批处理操作系统(Batch system) ...

  4. [No000005]C#注册表操作,创建,删除,修改,判断节点是否存在

    //用.NET下托管语言C#操作注册表,主要内容包括:注册表项的创建,打开与删除.键值的创建(设置值.修改),读取和删除.判断注册表项是否存在.判断键值是否存在. //准备工作: //1:要操作注册表 ...

  5. java 22 - 23 多线程之定时器的概述和使用例子

    定时器是一个应用十分广泛的线程工具,可用于调度多个定时任务以后台线程的方式执行. 在Java中,可以通过Timer和TimerTask类来实现定义调度的功能 开发中 Quartz是一个完全由java编 ...

  6. AFN 处理网络哪些事(轻松掌握AFN网络顶级框架)

    AFN 一.什么是AFN 全称是AFNetworking,是对NSURLConnection的一层封装 虽然运行效率没有ASI高,但是使用比ASI简单 在iOS开发中,使用比较广泛 AFN的githu ...

  7. Visual Studio 2013编辑HTML文件无设计视图的解决方案

    在Visual Studio 2013中编辑HTML文件,会发现没有设计视图. 解决方法:点击Visual Studio 2013的”工具“菜单,再点击”选项“—>文本编辑器—>文件扩展名 ...

  8. Integer.valueof(null)报错

    原文  http://javacat360.iteye.com/blog/2024378 主题 Java 昨天,一同事问我一个问题,估计是他前段日子面试遇到的 问题很简单,String.valueof ...

  9. Atom插件安装

    Atom插件安装 Atom狂拽炫酷插件之activate-power-mode 引语: 在前文中提到了关于插件的安装,似乎简单易操作,不过最后我发现是我自己想简单了. activate-power-m ...

  10. 实时监控log文件

    一个进程在运行,并在不断的写log,你需要实时监控log文件的更新(一般是debug时用),怎么办,不断的打开,关闭文件吗? 不用,至少有两个方法,来自两个很常用的命令: tail -f log.tx ...