Selective Search for Object Recognition（理解）

CZiFan 2024-10-15 11:51:45 原文

0 - 背景

　　在目标检测任务中，我们希望输入一副图像，输出目标所在的位置以及目标的类别。最常用的算法是滑动窗口方法，但滑动窗口其实相当于穷举图像中的所有子图像，其效率低且精度也受限。该论文提出一种新的生成目标检测框的方法selective search。

1 - 算法流程

　　　　　　　　

step 0：生成区域集R
step 1：计算区域集R中每个相邻区域的相似度S
step 2：找出最相似的两个区域，将其合并成新区域添加到R中
step 3：从S中移除所有与step 2中相关的区域
step 4：计算新集与所有子集的相似度
step 5：跳转到step 2，直到S集为空

1.1 - 相似度计算

1.1.1 - 颜色相似度（colour similarity）

　　将颜色空间转换成HSV，每个通道下以bins=25计算直方图，这样每个区域的颜色直方图有$25 \times 3=75$个区间。对直方图除以区域尺度做归一化后采用下式计算相似度：

$$s_{colour}(r_i,r_j)=\sum_{k=1}^{n}min(c_i^k,c_j^k)$$

　　（注：我的理解是，对于波峰波谷出现在相同区间，也即是直方图有相似趋势的两个区域相似度高，否则低）

1.1.2 - 纹理相似度（texture similarity）

　　采用方差为1的高斯分布在8个方向做梯度统计，然后将统计结果（尺寸与区域大小一致）以bins=10计算直方图，直方图区间数为$8 \times 3 \times 10=240$（使用RGB颜色区间）：

$$s_{texture}(r_i,r_j)=\sum_{k=1}^{n}min(t_i^k,t_j^k)$$

1.1.3 - 尺度相似度（size similarity）

　　保证合并操作较为均匀，避免一个大区域连续吞并其他小区域。举个例子，假设有区域a/b/c/d/e/f/g/h，理想的合并方式为ab/cd/ef/gh→abcd/efgh→abcdefgh，而不希望出现的合并方式为ab/c/d/e/f/g/h→abcd/e/f/g/h→abcdef/gh→abcdefgh。尺度相似度计算公式如下：

$$s_{size}(r_i,r_j)=1-\frac{size(r_i)+size(r_j)}{size(im)}$$

1.1.4 - 交叠相似度（shape compatibility measure）

$$s_{fill}(r_i,r_j)=1-\frac{size(BB_{ij})-size(r_i)-size(r_j)}{size(im)}$$

　　　　　　　　

1.1.5 - 最终相似度

$$s(r_i,r_j)=a_1s_{colour}(r_i,r_j)+a_2s_{texture}(r_i,r_j)+a_3s_{size}(r_i,r_j)+a_4s_{fill}(r_i,r_j)$$

2 - 实现

　　参照大神的代码自己复现一遍，代码在此。

3 - 参考资料

https://blog.csdn.net/guoyunfei20/article/details/78723646

https://github.com/AlpacaDB/selectivesearch

https://github.com/CZiFan/SelectiveSearch

Selective Search for Object Recognition（理解）的更多相关文章

[论文理解]Selective Search for Object Recognition
Selective Search for Object Recognition 简介 Selective Search是现在目标检测里面非常常用的方法,rcnn.frcnn等就是通过selective ...
目标检测--Selective Search for Object Recognition(IJCV, 2013)
Selective Search for Object Recognition 作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. ...
【计算机视觉】Selective Search for Object Recognition论文阅读3
Selective Search for Object Recoginition surgewong@gmail.com http://blog.csdn.net/surgewong 在前 ...
【计算机视觉】Selective Search for Object Recognition论文阅读1
Selective Search for Object Recognition 作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. ...
Notes on 'Selective Search For Object Recognition'
UijlingsIJCV2013, Selective Search For Object Recognition code 算法思想利用分割算法将图片细分成很多region, 或超像素. 在这个基 ...
论文笔记：Selective Search for Object Recognition
与 Selective Search 初次见面是在著名的物体检测论文「Rich feature hierarchies for accurate object detection and seman ...
Selective Search for Object Recognition
http://blog.csdn.net/charwing/article/details/27180421 Selective Search for Object Recognition 是J.R. ...
机器学习：Selective Search for Object Recognition
今天介绍 IJCV 2013 年的一篇文章,Selective Search for Object Recognition,这个是后面著名的DL架构 R-CNN 的基础,后续介绍 R-CNN 的时候, ...
【计算机视觉】Selective Search for Object Recognition论文阅读2
Selective Search for Object Recognition 是J.R.R. Uijlings发表在2012 IJCV上的一篇文章.主要介绍了选择性搜索(Selective Sear ...

随机推荐

centos7下kubernetes（16。kubernetes-滚动更新）
滚动更新:一次只更新一小部分副本,成功后,在更新更多的副本,最终完成所有副本的更新. 滚动更新的最大好处是零停机,整个更新过程始终有副本在运行,从而保证了业余的连续性下面部署三个副本的应用,出事镜像 ...
SpringCloud搭建Eureka集群
第一部分:搭建Eureka Server集群 Step1:新建工程,引入依赖依赖文件pom.xml如下 <?xml version="1.0" encoding=" ...
基于mybatis基本操作
实体在对上述三个实体操作中了解mybatis的实现全部代码 pro1是另外的一个完整项目用spring和struts2 hibernate 下载 https://github.com/Danov ...
Cards and Joy CodeForces - 999F （贪心+set）
There are nn players sitting at the card table. Each player has a favorite number. The favorite numb ...
iOS 基础：Frames、Bounds 和 CGGeometry
https://segmentfault.com/a/1190000004695617 原文:<iOS Fundamentals: Frames, Bounds, and CGGeometry& ...
允许外网连接到云服务器的mongodb服务器
通过 vi /etc/mongdb.conf 修改bind_ip 进行配置.
Oracle物化视图的创建及使用
oracle物化视图一.oracle物化视图基本概念物化视图首先需要创建物化视图日志, oracle依据用户创建的物化视图日志来创建物化视图日志表, 物化视图日志表的名称为mlog$_后面跟 ...
ASUS RT-AC68U 刷梅林固件及安装***插件记录（详细）
本文借鉴网络并亲自刷机过程记录(网上很多教程都不太详细) 版本:华硕ASUS RT- AC68U Wireless-AC1900 路由器的连接方式略,有说明书连好后打开浏览器输入:http:/ ...
使用jenkins进行前端项目自动部署
前面的话后端的nodeJS项目可以使用pm2进行自动部署,由于前端项目打包后是静态资源,不需要进程守护.一般地,前端项目使用jenkins来进行自动部署,包括打包.测试等一系列流程.本文将详细介绍j ...
poj2778（AC自动机+矩阵快速幂）
题意:给你n个字符串,问你长度为m的字符串且字符串中不含有那n个子串的字符串的数量解题思路:这道题一开始就不太懂,还以为是组合数学的题目,后面看了别人的博客,才知道这是属于AC自动机的另一种用法,是 ...