目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation

背景

　　在2012 Imagenet LSVRC比赛中，Alexnet以15.3%的top-5 错误率轻松拔得头筹（第二名top-5错误率为26.2%）。由此，ConvNet的潜力受到广泛认可，一炮而红。既然convNet在图像分类任务上能取得好成绩，是不是也能放到目标检测任务上呢。本文就是用convNet解决目标检测任务的首次探索。在PASCAL VOC 2010上的mAP达到了53.7%。

方法

　　模型一共分为三个模块。

　　(1)region proposals(区域推荐))。在一张整图上面产生很多的侯选框，因为目标检测任务不仅要做分类，还得把目标框出来。这里其实是用了遍历的思想，先把可能存在目标的位置全部列出来，再一个个分类。这里用到的是selective search算法。

　　(2)Feature extraction(特征提取)。这部分就是通过AlexNet的前5个conv层和前2个FC层对上面产生224*224*3的图片进行特征提取（注意：产生的子图片要resize到224*224*3,因为后面的FC层接受的是固定长度的vector），最终产生的是4096-d的feature vector。

　　(3)SVM分类。使用SVM方法对每个4096-d的feature vector进行分类。注意，原AlexNet里面分类是在后面加一个FC层，把4096-d的vector转成N-d(N是类别数)，然后用softmax算法做分类。作者之所以不用这种方法是因为实验中SVM方法效果更好。

　　(4)bbox regression(边框回归)。使用回归器精细修正候选框位置。

总结

　　可以发现，RCNN的原理十分简单，先用selective search算法在整图上产生n个子图，再把子图resize到224*224*3，然后扔到AlexNet里面(FC-softmax层去掉)，产生n个4096-d的vector,用SVM算法分类。

　　它的贡献在于是用convNet解决目标检测问题的开山之作，模型的mAP比传统方法高，让更多人通过ConvNet来解决目标检测问题。

缺点

　　(1)它的缺点当然也是很明显的，首先这种方法太暴力，一张图片要产生几千张子图，占用大量的磁盘空间；

　　(2)还有就是效率低，我们可以发现，几千张图片肯定有非常多重合的部分，然而这些重合部分都要分开来计算，产生了大量的冗余计算。

目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation的更多相关文章

论文笔记：Rich feature hierarchies for accurate object detection and semantic segmentation
在上计算机视觉这门课的时候,老师曾经留过一个作业:识别一张 A4 纸上的手写数字.按照传统的做法,这种手写体或者验证码识别的项目,都是按照定位+分割+识别的套路.但凡上网搜一下,就能找到一堆识别的教程 ...
目标检测（一）RCNN--Rich feature hierarchies for accurate object detection and semantic segmentation(v5)
作者:Ross Girshick,Jeff Donahue,Trevor Darrell,Jitendra Malik 该论文提出了一种简单且可扩展的检测算法,在VOC2012数据集上取得的mAP比当 ...
深度学习论文翻译解析（八）：Rich feature hierarchies for accurate object detection and semantic segmentation
论文标题:Rich feature hierarchies for accurate object detection and semantic segmentation 标题翻译:丰富的特征层次结构 ...
目标检测--Rich feature hierarchies for accurate object detection and semantic segmentation(CVPR 2014)
Rich feature hierarchies for accurate object detection and semantic segmentation 作者: Ross Girshick J ...
目标检测系列 --- RCNN: Rich feature hierarchies for accurate object detection and semantic segmentation Tech report
目标检测系列 --- RCNN: Rich feature hierarchies for accurate object detection and semantic segmentation Te ...
2 - Rich feature hierarchies for accurate object detection and semantic segmentation（阅读翻译）
Rich feature hierarchies for accurate object detection and semantic segmentation Ross Girshick Jeff ...
论文笔记（一）---翻译 Rich feature hierarchies for accurate object detection and semantic segmentation
论文网址: https://arxiv.org/abs/1311.2524 RCNN利用深度学习进行目标检测. 摘要可以将ImageNet上的进全图像分类而训练好的大型卷积神经网络用到PASCAL的 ...
论文阅读笔记二十四：Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(R-CNN CVPR2014)
论文源址:http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要在PASCAL VOC数据集上,最好的方法的思路是将低级信息与较高层次的上下文信息进 ...
R-CNN（Rich feature hierarchies for accurate object detection and semantic segmentation）论文理解
论文地址:https://arxiv.org/pdf/1311.2524.pdf 翻译请移步: https://www.cnblogs.com/xiaotongtt/p/6691103.html ht ...

随机推荐

selenium添加chrome配置项
selenium虽然强大,但也有不方便的地方,selenium每次启动浏览器都是一个全新的浏览器,并没有加载任何的配置,这样在爬取一些需要登陆才能看到的页面时就有些不太方便.但我们可以通过加载chro ...
[C2P3] Andrew Ng - Machine Learning
##Advice for Applying Machine Learning Applying machine learning in practice is not always straightf ...
Django cache (缓存)
五种配置 1.开发调试 # 此为开始调试用,实际内部不做任何操作 # 配置: CACHES = { 'default': { 'BACKEND': 'django.core.cache.backend ...
7.Java内存模型详解
https://blog.csdn.net/qq_37141773/article/details/103138476 一.虚拟机同样的java代码在不同平台生成的机器码肯定是不一样的,因为不同的操 ...
Moving x86 assembly to 64-bit (x86-64)
While 64-bit x86 processors have now been on the market for more than 5 years, software support is o ...
mq代替db
系统有个很严重的性能问题,法国人浪费了半年多都没有解决,他们试图从sql的角度分析哪里能有改善,大方向错了,再努力也没用. 我接手以后,也走了点弯路,一上手觉得肯定能用cache解决问题,结果cach ...
Codeforces Round #597 (Div. 2) D. Shichikuji and Power Grid 最小生成树
D. Shichikuji and Power Grid</centerD.> Shichikuji is the new resident deity of the South Blac ...
如果对象的引用被置为null，；垃圾回收器是否会立即释放对象占用的内存？
不会,在下一个垃圾回调周期中,这个对象将是被可回收的. 也就是说并不会立即被垃圾收集器立刻回收,而是在下一次垃圾回收时才会释放其占用的内存.
VBA基础 - 数据类型
概要学习一种新语言, 数据类型和关键字是第一步. 数据类型常用的数据类型如下: 类型存储空间范围 Boolean 2 bytes True 或者 False Byte 1 byte 0 ~ 2 ...
linux系统中启动daytime服务
环境:vmware下面的cetos6 1. 进入/etc/xinetd.d/目录下,查看是否存在daytime服务,若不存在,则须安装: 执行命令:yum install xinetd 该命令执行后会 ...

目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation

目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation的更多相关文章

随机推荐

热门专题