#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）

原文链接：https://www.52ml.net/20287.html

这篇博文主要讲了深度学习在目标检测中的发展。

博文首先介绍了传统的目标检测算法过程：

传统的目标检测一般使用滑动窗口的框架，主要包括三个步骤：

利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域；
提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征；行人检测和普通目标检测常用的HOG特征等；
利用分类器进行识别，比如常用的SVM模型。

基于深度学习的目标检测分为两派：

基于区域提名的，如R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN；
端到端（End-to-End），无需区域提名的，如YOLO、SSD。

目前来说，基于区域提名的方法依然占据上风，但端到端的方法速度上优势明显，后续的发展拭目以待。

接下来是对相关研究的详细介绍。

1、首先介绍的是区域提名--选择性搜索，以及用深度学习做目标检测的早期工作--Overfeat。

选择性搜索：不断迭代合并候选区域，已被弃用。

OverFeat: 用CNN做分类、定位和检测的经典之作（马克一记）。

2、基于区域提名的方法：主要介绍R-CNN系列

R-CNN:之前的工作都是用滑动窗口的方式，速度很慢，R-CNN采用的是selective search。

它和OverFeat类似，但缺点是速度慢。

SPP-net：针对剪裁技术可能出现的问题，SPP不管是对整副图像还是裁剪后的图像，都提取

相同维度的特征，这样可以统一送至全连接层。

FAST R-CNN:主要解决2000个候选框带来的重复计算问题。

FASTER R-CNN：抛弃了selective search，引入了RPN网格。

R-FCN：将最后的全连接层换为了卷积层。

3、端到端（end-to-end）:无需区域提名

YOLO：将448*448的图像分成S*S的网络，简化目标检测流程；

SSD: YOLO的改进，分为两部分：图像分类的网络和多尺度特征映射网络。

目标检测还存在一些问题，比如小目标检测问题。

#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）的更多相关文章

基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN,Faster R-CNN
基于深度学习的目标检测技术演进:R-CNN.Fast R-CNN,Faster R-CNN object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.obj ...
基于深度学习的目标检测（object detection）—— rcnn、fast-rcnn、faster-rcnn
模型和方法: 在深度学习求解目标检测问题之前的主流 detection 方法是,DPM(Deformable parts models), 度量与评价: mAP:mean Average Precis ...
基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN
object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.object detection要解决的问题就是物体在哪里,是什么这整个流程的问题.然而,这个问题 ...
（转）基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN
object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.object detection要解决的问题就是物体在哪里,是什么这整个流程的问题.然而,这个问题 ...
基于深度学习的目标检测算法：SSD——常见的目标检测算法
from:https://blog.csdn.net/u013989576/article/details/73439202 问题引入: 目前,常见的目标检测算法,如Faster R-CNN,存在着速 ...
Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1
3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...
Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...
Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...
基于深度学习的病毒检测技术无需沙箱环境，直接将样本文件转换为二维图片，进而应用改造后的卷积神经网络 Inception V4 进行训练和检测
话题 3: 基于深度学习的二进制恶意样本检测分享主题:全球正在经历一场由科技驱动的数字化转型,传统技术已经不能适应病毒数量飞速增长的发展态势.而基于沙箱的检测方案无法满足 APT 攻击的检测需求,也 ...

随机推荐

win7下如何建立ftp服务器
前段时间正在做一个项目,需要上传东西到ftp服务器,纠结于如何建立ftp服务器.经过一番摸索.终于成功建立ftp服务器.现将我的经验跟大家分享一下.不足之处还望多多指点! 步骤/方法首先在本地机器上 ...
TemplateDataField
.aspx <ig:TemplateDataField Key="TemplateField_0"> <Header Text="selected&qu ...
js 对象属性复制到另一个对象
var obj={a:1,b:2,c:3} var newObj={};for(var i in obj){newObj[i]=obj[i];}console.log(newObj);
NumberFormat类
NumberFormat表示数字的格式化类,即可以按照本地的风格习惯进行数字的显示. NumberFormat是一个抽象类,和MessageFormat类一样,都是Format类的子类,本类在使用时可 ...
在项目中那个少用if else 语句，精简代码，便于维护的方法（1）
一般我在写一个函数的时候,可能需要一个回调函数,例如: function loadQtipCode(dom, title, content, width, showcb, hidecb) { $(do ...
apk支持html video控制，是播放状态就暂停，暂停状态就播放
apk支持html video控制 <!DOCTYPE html> <html> <body> <div style="text-align:cen ...
Lua 之string库
标准string库基础字符串函数 string.len(s) 返回一个字符串的长度,例如 string.rep(s, n) 返回一个新的字符串,该字符串是参数s重复n次得到的结果,例如 )) -- ...
Drupal 7.31SQL注入getshell漏洞利用详解及EXP
0x00 这个漏洞威力确实很大,而且Drupal用的也比较多,使用Fuzzing跑字典应该可以扫出很多漏洞主机,但是做批量可能会对对方网站造成很大的损失,所以我也就只是写个Exp不再深入下去. 0x0 ...
理解OAuth2.0
原文地址:http://www.ruanyifeng.com/blog/2014/05/oauth_2_0.html
HBase命令(一) -- 库操作
打开数据库 bin/start-hbase.sh //打开HBase bin/hbase shell //以命令行的方式打开Hbase控制台 Rest接口开启 bin/hbase rest //普通的 ...

#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）

#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）的更多相关文章

随机推荐

热门专题