ILSVRC 2014结束一段时间了。从下面的表格来看,基本都是RCNN的路子,但是这些牛队都做了改进。自己和人家比差的太远啊,努力。

team

results

Spotlights and improve

GoogLeNet

0.439329(6 m)

0.38(1m)

Rcnn

1. Increase size of super-pixels by 2X

2. Add multibox* proposals

CUHK DeepID-Net

0.406659

RCNN +

Bounding box rejection using def-pooling layer

1000 object-level annotation

200 object-level annotation

Deep Insight

0.404517

Original RCNN

+ 9conv + SPM

+ more iterations

+ Structural Edge Proposal

+ 7/8/9 Conv Ensemble

+ CLS Context

NUS

0.37212

Rcnn framework, with nin in cnn

UvA-Euvision

0.354213(aug)

0.32.253(prov)

Selective search + cnn

MSRA Visual Computing

0.351103

A combination of multiple SPP-net-based models (no outside data)

Berkeley Vision

0.345213

R-CNN baseline

读这些单位的文章,记录一下:

Googlenet,测试过,确实减少了量。

deepid用1000类的bb训练,在200类的BB做fine tuning.还类似于SPP一样,引入了一个pooling层。

NUS,用了nin,其中使用的是hcp,其思路就是用bing生成若干个regions,计算这些regions之间的iou作为weights,然后利用normalized cuts等进行聚类,减少regions的个数,然后再利用CNN进行特征提取和分类,在分类后,每一个regions得到一个c类的vector,然后对这些region的vectors通过max pooling,得到该张图片的mult labels。这个方法大大提高了像pascal的分类这些多类分类的效果,其实是借助于检测达到分类效果,速度应该慢。但是从检测上来说,效果肯定差,因为使用的regions数目少,再者本身聚类得到的regions很难保证是最好的?其中提到用到了ctx信息,今天找到他们的ctx文章,看了一下,说不麻烦吧,还挺麻烦的。基本上从原理上来讲,就是对特征扩展了维度信息,比如对分类来说,检测的结果输出是ctx信息,检测的结果可以取top 2的结果。而对检测来说,分类的结果可以作为其ctx信息,比如文中用到的bow信息。个人感觉吧,单纯就在训练svm时添加上这些信息,应该是有帮助的,文章中写的那么复杂,可能做的时候应该没那么复杂,可惜作者没公开代码。猜测在检测中,如果走rcnn的路线,通过cnn得到的分类结果,将结果作为ctx信息。

微软的SPP,这几天把windows版本的搭建起来了,速度确实比rcnn快,而且可以随意输入大小,确实很赞。

ILSVRC2014检测总结的更多相关文章

  1. 【目标检测】SSD:

    slides 讲得是相当清楚了: http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf 配合中文翻译来看: https://www.cnb ...

  2. 论文翻译——R-CNN(目标检测开山之作)

    R-CNN论文翻译 <Rich feature hierarchies for accurate object detection and semantic segmentation> 用 ...

  3. dll文件32位64位检测工具以及Windows文件夹SysWow64的坑

    自从操作系统升级到64位以后,就要不断的需要面对32位.64位的问题.相信有很多人并不是很清楚32位程序与64位程序的区别,以及Program Files (x86),Program Files的区别 ...

  4. Android性能优化之利用LeakCanary检测内存泄漏及解决办法

    前言: 最近公司C轮融资成功了,移动团队准备扩大一下,需要招聘Android开发工程师,陆陆续续面试了几位Android应聘者,面试过程中聊到性能优化中如何避免内存泄漏问题时,很少有人全面的回答上来. ...

  5. C++的内存泄漏检测

    C++大量的手动分配.回收内存是存在风险的,也许一个函数中一小块内存泄漏被重复放大之后,最后掏空内存. 这里介绍一种在debug模式下测试内存泄漏的方法. 首先在文件的开头以确定的顺序写下这段代码: ...

  6. 使用 Android Studio 检测内存泄漏与解决内存泄漏问题

    本文在腾讯技术推文上 修改 发布. http://wetest.qq.com/lab/view/63.html?from=ads_test2_qqtips&sessionUserType=BF ...

  7. iOS网络4——Reachability检测网络状态

    一.整体介绍 前面已经介绍了网络访问的NSURLSession.NSURLConnection,还有网页加载有关的webview,基本满足通常的网络相关的开发. 其实在网络开发中还有比较常用的就是网络 ...

  8. SQL Server数据库损坏、检测以及简单的修复办法

    简介     在一个理想的世界中,不会存在任何数据库的损坏,就像我们不会将一些严重意外情况列入我们生活中的日常一样,而一旦这类事情发生,一定会对我们的生活造成非常显著的影响,在SQL Server中也 ...

  9. STM32的入侵检测是干什么用的

    [引]:侵入检测的作用就是监测侵入事件,保护重要的数据不被非法窃取. 你的数据是保存在RAM里的;但是一掉电RAM里的数据就没了;有一块地方,后备电池相关的一块RAM的数据却放不掉(除非电池没电了); ...

随机推荐

  1. sql server 笔记(数据类型/新建、修改、删除数据表/)

    1.数据类型: Character 字符串 / Unicode 字符串 / Binary 类型 / Number 类型  /  Date 类型  / 其他数据类型 详解:http://www.w3sc ...

  2. 通过navigator.userAgent判断浏览器类型

    1.navigator.userAgent返回一个浏览器信息字符串. 2.用到indexOf()方法,查找字符串中是否有指定的浏览器类型. 3. if(navigator.userAgent.inde ...

  3. C. Permute Digits dfs大模拟

    http://codeforces.com/contest/915/problem/C 这题麻烦在前导0可以直接删除,比如 1001 100 应该输出11就好 我的做法是用dfs,每一位每一位的比较. ...

  4. 根据时间显示不同的问候语的JavaScript代码

    对于最近有许多的初学开发者问我关于根据时间显示不同的问候语的JavaScript代码问题,所以今天将自己整理的一些代码在这里分享出来,供初学者参考,如果在运行过程中有问题,可以给我在下方留言. < ...

  5. Java中的阻塞队列-LinkedBlockingQueue(二)

    原文地址:http://benjaminwhx.com/2018/05/11/%E3%80%90%E7%BB%86%E8%B0%88Java%E5%B9%B6%E5%8F%91%E3%80%91%E8 ...

  6. Spring-cloud学习线路

    学习本学习路线学习完,大家将会对微服务.Spring Cloud.Docker.Kubernetes有一个系统.全面的认识.通过学习,将能掌握相关的知识体系,并能够投入到项目实战中去. 本学习路线采用 ...

  7. 配置Slf4j依赖,桥接各种多个日志组件(排除commons-logging依赖的影响)

    由于各个jar组件使用的日志框架不一样,实际项目中可能会引入多个jar,通常使用的日志框架有 commons-logging log4j 若同一个项目引入多个日志组件,那么Slf4j组件会有不能捕捉到 ...

  8. C++中的虚函数表

    (感谢http://blog.csdn.net/haoel/article/details/1948051/) C++中的虚函数的作用主要是实现了多态的机制. 多态,简而言之就是用父类型别的指针指向其 ...

  9. vue学习第三天 ------ 临时笔记

    说明:之前两天属于入门,文章可能存在片段信息 vue2.x+webpack快速搭建前端项目框架详解 http://www.jb51.net/article/129463.htmVue cli + We ...

  10. css 伪元素选择器

    /*设置第一个首字母的样式*/ p:first-letter{ color: red; font-size: 30px; } /* 在....之前 添加内容 这个属性使用不是很频繁 了解 使用此伪元素 ...