【计算机视觉】Object Proposal之BING理解

发现：

本论文主要有两大亮点。第一个亮点是发现了在固定窗口的大小下，物体与背景的梯度模式有所不同。如图1所示。图1（a）中绿框代表背景，红框代表物体。如果把这些框都resize成固定大小，比如8X8，然后求出8X8这些块中每个点的梯度（Normed
Gradient，本文的结果为[0,255],之前看错成Normalized...估计这里的normed就是指窗口都resize成8X8），可以明显看到物体与背景的梯度模式的差别，如图1（c）所示，物体的梯度分布呈现出较为杂乱的模式，而背景的较为单一和清楚。其实这个道理很浅显，就是图像中背景区域往往呈现出homogeneous的特性，早期的图像区域分割方法就是依靠这种特性来做的。然后我个人觉得这里不一定要用梯度，用其他一些统计特征甚至是图像特征都有可能得到类似的结果。

: Binarized Normed Gradients for Objectness Estimation at 300fps 论文笔记" title="BING : Binarized Normed Gradients for Objectness Estimation at 300fps 论文笔记" style="margin:0px;padding:0px;border:0px;list-style:none;">

找到上面的规律就好办了！

首先找一堆训练图像，（作者提供的图片集有许多，九千多张），每一个图片都有目标，并且目标所在的位置都在yml文件中标出来了，这样每一个图片有多个训练样本程序作者放到gtTrainBoxes和
gtTestBoxes（Ground truth bounding boxes for training and testing images）每个训练图像采集若干个窗口并resize到8X8的大小，然后将这些8X8的矩阵向量化得到若干个64维的向量，把这些向量扔进一个线性分类器去训练就ok了：

训练部分：采用级联的SVM 进行的训练。

作者分了两个阶段对训练样训练；

第一个阶段：

参考：http://blog.csdn.net/k123han123/article/details/25740355

【计算机视觉】Object Proposal之BING理解的更多相关文章

【计算机视觉】Object Proposal之BING++
本文是对 BING 算法的升级,主要是在快的同时保持定位精度两个 + 分别对应: edge-based recursive boxes as one "+", and MTSE ...
【计算机视觉】detection/region/object proposal 方法综述文章
目录(?)[-] Papers 大纲各种OP方法的回顾 Grouping proposal methods Window scoring proposal methods Aliternate pr ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（理解）
0 - 背景 R-CNN中检测步骤分成很多步骤,fast-RCNN便基于此进行改进,将region proposals的特征提取融合成共享卷积层问题,但是,fast-RCNN仍然采用了selectiv ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文理解
一.创新点和解决的问题创新点设计Region Proposal Networks[RPN],利用CNN卷积操作后的特征图生成region proposals,代替了Selective Search ...
Object对象你真理解了吗？
前言五一回家又断更了一个放假时间了~~~ 只有光头才能变强回顾前面: ThreadLocal就是这么简单多线程三分钟就可以入个门了! 多线程基础必要知识点!看了学习多线程事半功倍 Java锁机制 ...
JDK8下Object类源码理解
JDK8中Object类提供的方法: package java.lang; /** * Class {@code Object} is the root of the class hierarchy. ...
Object.keys()的简单理解
1.对象的话返回属性名 var obj = {'a':'123','b':'345'}; console.log(Object.keys(obj)); //['a','b'] var obj1 = { ...
RPN(region proposal network)之理解
在faster-r-cnn 中,因为引入rpn层,使得算法速度变快了不少,其实rpn主要作用预测的是 “相对的平移,缩放尺度”,rpn提取出的proposals通常要和anchor box进行拟合回归 ...
『计算机视觉』FPN：feature pyramid networks for object detection
对用卷积神经网络进行目标检测方法的一种改进,通过提取多尺度的特征信息进行融合,进而提高目标检测的精度,特别是在小物体检测上的精度.FPN是ResNet或DenseNet等通用特征提取网络的附加组件,可 ...

随机推荐

【原创】go语言学习（二十）并发编程
目录并发和并行 Goroutine初探 Goroutine实战 Goroutine原理浅析 Channel介绍 Waitgroup介绍 Workerpool的实现并发和并行 1.概念A. 并发:同 ...
[HNOI2011]括号修复 / [JSOI2011]括号序列
传送门 Solution 一道题花费了两天的时间-- 在大佬@PinkRabbit的帮助下,终于AC了,感动-- 首先,我们考虑一个括号序列被修改成合法序列需要的次数: 我们需要修改的其实是形如... ...
hdu4283
You Are the One Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
[大数据相关] Hive中的全排序：order by,sort by, distribute by
写mapreduce程序时,如果reduce个数>1,想要实现全排序需要控制好map的输出,详见Hadoop简单实现全排序. 现在学了hive,写sql大家都很熟悉,如果一个order by解决 ...
RK3288 修改ddr频率
转载请注明出处:https://www.cnblogs.com/lialong1st/p/10912334.html CPU:RK3288 系统:Android 5.1 RK3288 的 ddr 频率 ...
Colab使用教程
目录有关链接使用GPU 切换文件夹参考有关链接 Google Colabratory Google Drive 使用GPU 以下两种方式都可以: "修改"->&quo ...
OpenJudge计算概论-大象喝水
/*========================================================= 大象喝水总时间限制: 1000ms 内存限制: 65536kB 描述一只大象 ...
java中 int、char、long各占多少字节数
所谓的占用字节数就是申请内存的时候所占的空间大小 byte 1字节最小值是 -128(-2^7): 最大值是 127(2^7-1): boolean 至少1字节这种类型只作为一 ...
SWT界面刷新
参考文章: https://segmentfault.com/q/1010000002956350 在UI线程sleep等待,是不会刷新界面的. outPrint.setText("其他 ...
Win10系统安装VMware-viclient-6.0无响应问题解决方法
背景:笔记本重做系统升级至Win10系统后,由于工作需要,得安装VMware-viclient-6.0软件进行远程连接. 问题:没有出现网上那种各种报错情况,只是在点击“安装”按钮的时候没弹出任何等待 ...

【计算机视觉】Object Proposal之BING理解

【计算机视觉】Object Proposal之BING理解的更多相关文章

随机推荐

热门专题