第五讲_图像识别之图像检测Image Detection

目录
物体检测
ILSVRC竞赛200类(每个图片多个标签)：输出类别+Bounding Box（x,y,w,h）
PASCAL VOC 2012只有20类
模型进化

区域卷积神经网络R-CNN-2014

模型结构
selective search+CNN特征+svm+Bounding box regression
Regiom proposals
训练流程
测试阶段
RCNN性能大幅提升

SPPNet网络-2014

R-CNN速度慢的重要原因：卷积特征重复计算量太大
spp技术实现了共享计算，适应不同输入尺寸
SPP层具体实现
sppNet问题

Fast-R-CNN-2015

改进；更高mAP(类似AUC曲线下的面积)
网络结构
训练阶段

Faster-R-CNN-2015

概况，引导CNN关注区域
Region Proposal Network
训练过程

区域全卷积神经网络R-FCN

回顾
F-RCN的设计过程
分类问题对尺寸，方向等变换不敏感，网络越深，分类效果很好；但是检测对变换敏感
结构图：三部分
理解K2(C+1)个通道，映射到每类K2个score map

人脸检测/行人检测

主流数据库
WIDER FACE
IJB-A
Caltech

第五讲_图像识别之图像检测Image Detection的更多相关文章

使用YOLOv2进行图像检测
基本配置信息 tensorflow (1.4.0) tensorflow-tensorboard (0.4.0) Keras (2.1.5) Python (3.6.0) Anaconda 4.3.1 ...
『科学计算』图像检测微型demo
这里是课上老师给出的一个示例程序,演示图像检测的过程,本来以为是传统的滑窗检测,但实际上引入了selectivesearch来选择候选窗,所以看思路应该是RCNN的范畴,蛮有意思的,由于老师的注释写的 ...
第四讲_图像识别之图像分类Image Classification
第四讲_图像识别之图像分类Image Classification 目录图片分类性能指标:top1,top5 ILSVRC:每种任务数据集不一样 imageNet:根据WorldNet组织的图片集 ...
异常检测(Anomaly Detection)
十五.异常检测(Anomaly Detection) 15.1 问题的动机参考文档: 15 - 1 - Problem Motivation (8 min).mkv 在接下来的一系列视频中,我将向大 ...
结合Python代码介绍音符起始点检测 (onset detection)
本文由 meelo 原创,请务必以链接形式注明本文地址音符起始点检测介绍音符起始点检测(onset detection)是音乐信号处理中非常重要的一个算法.节拍和速度(tempo)的检测都会基于 ...
[C10] 异常检测(Anomaly Detection)
异常检测(Anomaly Detection) 问题的动机 (Problem Motivation) 异常检测(Anomaly detection)问题是机器学习算法中的一个常见应用.这种算法的有趣之 ...
机器学习（十一）-------- 异常检测(Anomaly Detection)
异常检测(Anomaly Detection) 给定数据集
图像检测之sift and surf---sift中的DOG图 surf hessian
http://www.cnblogs.com/tornadomeet/archive/2012/08/17/2644903.html http://www.cnblogs.com/slysky/arc ...
04747_Java语言程序设计（一）_第7章_图形、图像与多媒体
例7.1小应用程序用6种字型显示字符串,显示内容说明本身的字型. import java.applet.*; import java.awt.*; public class Example7_1 ex ...

随机推荐

navicat for mysql 在win7下设置定时计划之导出数据处理
navicat for mysql 在win7下设置定时计划之导出数据处理博客分类: mysql navitcatmysql定时任务导出前两篇记录了,navicat for mysql计划的入门 ...
MFC自绘按钮的实现，按钮动态效果
最近项目需要实现按钮的动态效果,多方学习,现在终于能实现一些功能了. 过程如下: 第一,新建一MFC对话框应用程序. 第二,删除自带按钮,并添加两个按钮,button1,button2,ID为IDB_ ...
[UnicodeEncodeError]:Django中解决URL中文解释乱码问题
Django中在使用HttpResponseRedirect的时候,跳转URL中如果存在中文,会报错:会报UnicodeEncodeError错误. 解决办法: 使用urlquote对URL进行编码 ...
多元线性回归(pandas/scikit-learn)
import pandas as pd from sklearn.cross_validation import train_test_split from sklearn.linear_model ...
【Luogu】P2221高速公路（线段树乱搞）
题目链接这题……我从一开始就想歪了qwq. 为了缅怀逝去的一小时我就把我的30分暴力思路放上来. 首先我们观察枚举的区间.假设我们要枚举的范围是1~5之间的四条路,为了方便我们把它们叫做abcd. ...
Django的标准库django.contrib包介绍
原文地址:http://www.nowamagic.net/academy/detail/1318716 前面我们激活了 Django 后台,我们要使用自动化的站点管理工具(django.contri ...
标准C程序设计七---64
Linux应用编程深入语言编程标准C程序设计七---经典C11程序设计以下内容为阅读: <标准C程序设计>(第7版) 作者 ...
第6章 I/O多路复用
前一章节客户端同时处理两个输入:标准输入和TCP套接字,然而问题在于客户端阻塞于fgets调用期,服务器进程被杀死后,服务器tcp虽然可以正确发送一个fin,但进程正阻塞于标准输入,它无法看到eof, ...
PHP获取今天开始和结束的时间戳
$t = time();$start = mktime(0,0,0,date("m",$t),date("d",$t),date("Y",$ ...
C#读取Excel 几种方法的体会
(1) OleDb: 用这种方法读取Excel速度还是非常的快的,但这种方式读取数据的时候不太灵活,不过可以在 DataTable 中对数据进行一些删减修改这种方式将Excel作为一个数据源,直接用 ...

第五讲_图像识别之图像检测Image Detection

第五讲_图像识别之图像检测Image Detection

区域卷积神经网络R-CNN-2014

SPPNet网络-2014

Fast-R-CNN-2015

Faster-R-CNN-2015

区域全卷积神经网络R-FCN

人脸检测/行人检测

第五讲_图像识别之图像检测Image Detection的更多相关文章

随机推荐

热门专题