Notes on 'Efficient Graph-Based Image Segmentation'
Notes on Efficient Graph-Based Image Segmentation
算法的目标
按照一种确定的标准, 将图片分割成细粒度的语义区域, 即Super pixel.
算法步骤
- 预处理. 将图片转换为undirected graph: \(G(V, E)\):
- 每一个像素都是一个顶点.
- 只有相邻像素间才存在边
- 边的权重为它连接的两个顶点间的像素距离
作者的代码使用了欧氏距离
- Steps:
- 将\(E\)按权重递增排序: \(\pi = (e_1, e_2, \dots, e_m)\)
- \(S^0 = V\), 即一开始每个顶点都一个单独的region.
- 重复4直到处理完所有的边得到\(S^1, S^2, \dots, S^{m - 1}, S^m\):
- \(S^q\)由\(S^{q - 1}\)得到:
- \(e_q = <v_i, v_j>\)
- 如果: (1) \(v_i, v_j\)不在\(S^{q - 1}\)的同一个连通区域内, 即:\(C_i^{q -1} \neq C_j^{q - 1}\), 且(2)\(e_q\)的权重比两个component内部的像素差异要小, 即:\(w(e_q) < MInt(C_i^{q -1}, C_j^{q - 1})\), 则将\(C_i^{q -1}, C_j^{q - 1}\)在\(S^{q-1}\)内合并.
- \(S^q = S^{q - 1}\)
- Return \(S^m\)
从之前的构图, 到后面的merge, 都是很常规的做法. 算法的关键在于\(MInt(C_i, C_i)\)函数上, 即如何决定是否合并两个相邻像素/相邻区域.
注意, region/区域与component/连通分量在此处含义相同, 可交换使用
Pairwise Region Comparison
具体参考原文Section 3.1
在考虑是否要将两个region合并成一个region时, 需要考虑internal-region的像素差异程度与inter-region的像素差异.
region内部的差异定义为这个region的最小生成树的最大权重:
\[
Int(C) = \max_{e\in MST(C, E)}w(e)
\]
region间的差异定义为连接两个region的最小边的权重:
\[
Dif(C_1, C_2) = \min_{v_i \in C_1, v_j \in C2, <v_i, v_j> \in E} w(<v_i, v_j>)
\]
这个值在上面的算法中为\(w(e_q)\).
\[
MInt(C_1, C_2) = min(Int(C_1) + \tau(C_1), Int(C_2) + \tau(C_2))
\]
其中, \(\tau(C) = \frac {k}{|C|}\). \(k\)是一个指定的常数. \(|C|\)是region的面积(包含的像素个数).
\(Dif(C_1, C_2) < MInt(C_1, C_2)\)是合并\(C_1, C_2\)的前提条件. 之所以加入\(\tau(C)\), 是为了降低小region合并的门槛.
需要设定的参数
- \(\sigma\): 在分割图片之前需要对其进行高斯平滑操作, 使用期望为0, 方差为\(\sigma^2\)的高斯分布.
- \(k\): \(\tau = \frac {k}{|C|}\) 里的\(k\), \(k\)越大, 最后分割出的region也偏大
- \(min_area\): 在初次分割完之后, 会有很多小region, \(min_area\)用于判断小region, 然后将小region合并
Notes on 'Efficient Graph-Based Image Segmentation'的更多相关文章
- VIPS: a VIsion based Page Segmentation Algorithm
VIPS: a VIsion based Page Segmentation Algorithm VIPS: a VIsion based Page Segmentation Algorithm In ...
- Graph Based SLAM 基本原理
作者 | Alex 01 引言 SLAM 基本框架大致分为两大类:基于概率的方法如 EKF, UKF, particle filters 和基于图的方法 .基于图的方法本质上是种优化方法,一个以最小化 ...
- 论文解读(GCC)《Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering》
论文信息 论文标题:Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering论文作者:Chaki ...
- 论文阅读笔记五十二:CornerNet-Lite: Efficient Keypoint Based Object Detection(CVPR2019)
论文原址:https://arxiv.org/pdf/1904.08900.pdf github:https://github.com/princeton-vl/CornerNet-Lite 摘要 基 ...
- 论文阅读-Temporal Phenotyping from Longitudinal Electronic Health Records: A Graph Based Framework
- Awesome Deep Vision
Awesome Deep Vision A curated list of deep learning resources for computer vision, inspired by awes ...
- Computer Vision Tutorials from Conferences (3) -- CVPR
CVPR 2013 (http://www.pamitc.org/cvpr13/tutorials.php) Foundations of Spatial SpectroscopyJames Cogg ...
- PP: Extracting statisticla graph features for accurate and efficient time series classification
Problem: TSC, time series classification; Traditional TSC: find global similarities or local pattern ...
- Survey of single-target visual tracking methods based on online learning 翻译
基于在线学习的单目标跟踪算法调研 摘要 视觉跟踪在计算机视觉和机器人学领域是一个流行和有挑战的话题.由于多种场景下出现的目标外貌和复杂环境变量的改变,先进的跟踪框架就有必要采用在线学习的原理.本论文简 ...
随机推荐
- 【转】最长回文子串的O(n)的Manacher算法
Manacher算法 首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长.这个算法可以在O(n)的时间复杂度内既线性时间复杂度的情况下,求出以每个字符为中心的最长回文 ...
- 三维网格去噪算法(two-step framework)
基于两步法的网格去噪算法顾名思义包含两个步骤:首先对网格表面的法向进行滤波,得到调整后的网格法向信息,然后根据调整后的法向更新顶点坐标位置,下面介绍三篇该类型的文章. [Sun et al. 2007 ...
- python pyperclip模块的使用
用途: 复制,粘贴 用法: >>> import pyperclip >>> pyperclip.copy('Hello world!') >>> ...
- AC日记——回文子串 openjudge 1.7 34
34:回文子串 总时间限制: 1000ms 内存限制: 65536kB 描述 给定一个字符串,输出所有长度至少为2的回文子串. 回文子串即从左往右输出和从右往左输出结果是一样的字符串,比如:abb ...
- AC日记——统计数字字符个数 openjudge 1.7 01
01:统计数字字符个数 总时间限制: 1000ms 内存限制: 65536kB 描述 输入一行字符,统计出其中数字字符的个数. 输入 一行字符串,总长度不超过255. 输出 输出为1行,输出字符串 ...
- easyUI的dateBox控制时间格式
<input type='text' name='yearQuery' class='easyui-datebox ' data-options="formatter:myformat ...
- Linux设备驱动之中断支持及中断分层
快速中断:在开启快速中断时,其他中断不会打断快速中断. 多个中断共享一个中断号. 中断行为受到限制: 1.不能使用可能引起阻塞的函数 2.不能使用可能引起调度的函数 中断注册:request_irq( ...
- 关于Kendo UI的使用心得
1.在筛选里面的条件选项进行编辑 filterable: { extra: false, operators: { string: { startswith: "Starts with&qu ...
- MySQL日志管理
MySQL日志管理 2013年09月26日 ⁄ MySQL ⁄ 共 14266字 ⁄ 评论数 ⁄ 被围观 , views+ 一.日志类型: MySQL有几个不同的日志文件,可以帮助你找出mysqld内 ...
- Codevs 1860 最大数 string大法好,STL万岁。。
题目描述 Description 设有n个正整数(n≤20),将它们联接成一排,组成一个最大的多位整数. 输入描述 Input Description 第一行一个正整数n. 第二行n个正整数,空格隔开 ...