ILSVRC2014检测总结
ILSVRC 2014结束一段时间了。从下面的表格来看,基本都是RCNN的路子,但是这些牛队都做了改进。自己和人家比差的太远啊,努力。
|
team |
results |
Spotlights and improve |
|
GoogLeNet |
0.439329(6 m) 0.38(1m) |
Rcnn 1. Increase size of super-pixels by 2X 2. Add multibox* proposals |
|
CUHK DeepID-Net |
0.406659 |
RCNN + Bounding box rejection using def-pooling layer 1000 object-level annotation 200 object-level annotation |
|
Deep Insight |
0.404517 |
Original RCNN + 9conv + SPM + more iterations + Structural Edge Proposal + 7/8/9 Conv Ensemble + CLS Context |
|
NUS |
0.37212 |
Rcnn framework, with nin in cnn |
|
UvA-Euvision |
0.354213(aug) 0.32.253(prov) |
Selective search + cnn |
|
MSRA Visual Computing |
0.351103 |
A combination of multiple SPP-net-based models (no outside data) |
|
Berkeley Vision |
0.345213 |
R-CNN baseline |
读这些单位的文章,记录一下:
Googlenet,测试过,确实减少了量。
deepid用1000类的bb训练,在200类的BB做fine tuning.还类似于SPP一样,引入了一个pooling层。
NUS,用了nin,其中使用的是hcp,其思路就是用bing生成若干个regions,计算这些regions之间的iou作为weights,然后利用normalized cuts等进行聚类,减少regions的个数,然后再利用CNN进行特征提取和分类,在分类后,每一个regions得到一个c类的vector,然后对这些region的vectors通过max pooling,得到该张图片的mult labels。这个方法大大提高了像pascal的分类这些多类分类的效果,其实是借助于检测达到分类效果,速度应该慢。但是从检测上来说,效果肯定差,因为使用的regions数目少,再者本身聚类得到的regions很难保证是最好的?其中提到用到了ctx信息,今天找到他们的ctx文章,看了一下,说不麻烦吧,还挺麻烦的。基本上从原理上来讲,就是对特征扩展了维度信息,比如对分类来说,检测的结果输出是ctx信息,检测的结果可以取top 2的结果。而对检测来说,分类的结果可以作为其ctx信息,比如文中用到的bow信息。个人感觉吧,单纯就在训练svm时添加上这些信息,应该是有帮助的,文章中写的那么复杂,可能做的时候应该没那么复杂,可惜作者没公开代码。猜测在检测中,如果走rcnn的路线,通过cnn得到的分类结果,将结果作为ctx信息。
微软的SPP,这几天把windows版本的搭建起来了,速度确实比rcnn快,而且可以随意输入大小,确实很赞。
ILSVRC2014检测总结的更多相关文章
- 【目标检测】SSD:
slides 讲得是相当清楚了: http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf 配合中文翻译来看: https://www.cnb ...
- 论文翻译——R-CNN(目标检测开山之作)
R-CNN论文翻译 <Rich feature hierarchies for accurate object detection and semantic segmentation> 用 ...
- dll文件32位64位检测工具以及Windows文件夹SysWow64的坑
自从操作系统升级到64位以后,就要不断的需要面对32位.64位的问题.相信有很多人并不是很清楚32位程序与64位程序的区别,以及Program Files (x86),Program Files的区别 ...
- Android性能优化之利用LeakCanary检测内存泄漏及解决办法
前言: 最近公司C轮融资成功了,移动团队准备扩大一下,需要招聘Android开发工程师,陆陆续续面试了几位Android应聘者,面试过程中聊到性能优化中如何避免内存泄漏问题时,很少有人全面的回答上来. ...
- C++的内存泄漏检测
C++大量的手动分配.回收内存是存在风险的,也许一个函数中一小块内存泄漏被重复放大之后,最后掏空内存. 这里介绍一种在debug模式下测试内存泄漏的方法. 首先在文件的开头以确定的顺序写下这段代码: ...
- 使用 Android Studio 检测内存泄漏与解决内存泄漏问题
本文在腾讯技术推文上 修改 发布. http://wetest.qq.com/lab/view/63.html?from=ads_test2_qqtips&sessionUserType=BF ...
- iOS网络4——Reachability检测网络状态
一.整体介绍 前面已经介绍了网络访问的NSURLSession.NSURLConnection,还有网页加载有关的webview,基本满足通常的网络相关的开发. 其实在网络开发中还有比较常用的就是网络 ...
- SQL Server数据库损坏、检测以及简单的修复办法
简介 在一个理想的世界中,不会存在任何数据库的损坏,就像我们不会将一些严重意外情况列入我们生活中的日常一样,而一旦这类事情发生,一定会对我们的生活造成非常显著的影响,在SQL Server中也 ...
- STM32的入侵检测是干什么用的
[引]:侵入检测的作用就是监测侵入事件,保护重要的数据不被非法窃取. 你的数据是保存在RAM里的;但是一掉电RAM里的数据就没了;有一块地方,后备电池相关的一块RAM的数据却放不掉(除非电池没电了); ...
随机推荐
- Unity脚本的生命周期 同一脚本/不同脚本/游戏对象激没激活/脚本激没激活,几种情况下的Awake,OnEnable,Start的执行顺序
可以自己在Unity里面试一下 游戏对象在Hierarchy面板不是激活的,它的脚本没作用,脚本中的函数不会执行; 游戏对象在Hierarchy面板是激活的,脚本没激活,Awake会执行,OnEnab ...
- UI3D转2D平面显示UI3DTo2D血条显示
UI3D转2D平面显示UI3DTo2D血条显示: using UnityEngine; using System.Collections; public class UI3DTo2D : MonoBe ...
- LoadScene场景异步加载
LoadScene场景异步加载 using UnityEngine; using System.Collections; using UnityEngine.SceneManagement; usin ...
- redis数据类型及常用命令使用
redis干啥的,一般人都知道,但很多人只知道是个缓存数据库,其它的就不知道了,本猿无能亦是如此,然知耻而后勇,我们该理一理这里边的一些逻辑,看看redis究竟是怎么一回事儿,能干啥,怎么做的,这样才 ...
- JEECMS站群管理系统-- 标签使用和模板的制作
1模板规划 1.1资源文件 资源文件就是网页中用到的图片.CSS.JS等元素,在CMS系统中所有的资源文件在网站的根目录中的 /res_base/所属网站定义资源目录/TEMPLEATE/WEB /r ...
- for循环笔记
JS获取元素方法——ById和ByTagName方法的区别 1.通过id获取,前面就只能是document,不能是其他的,但是ByTagName前面可以是document,也可以跟一个别的元素 #li ...
- [转] Java集合类详解
集合类说明及区别Collection├List│├LinkedList│├ArrayList│└Vector│ └Stack└SetMap├Hashtable├HashMap└WeakHashMap ...
- ASP.NET那点不为人知的事(一)
http://www.cnblogs.com/OceanEyes/archive/2012/08/13/aspnetEssential-1.html#_label0 我们上网时,在浏览器地址输入网址: ...
- synchronized + volatile + ThreadLocal
线程的共享 synchronized + volatile + ThreadLocal <1> synchronized 锁住的是对象,当用它来锁住一个类时,实际上也是锁的一个对象. ...
- jQuery的下拉框应用
jQuery的下拉框应用 jQuery的下拉框左右选择应用 直接上代码 <!DOCTYPE html> <html> <head> <meta charset ...