最近的阅读list
fast rcnn
统一了sppnet和rcnn,将原来rcnn分stage的训练合为一个整体的stage,一次完成cls, regression的训练。引入两个loss函数,一个是用来进行cls的,一个是进行regression的,这个思路其实是和google的multibox类似的,但是不同的是regression是对bbox的,而bbox怎么引入到cnn中,同时还可以进行训练呢,这就是sppnet的思路了。fast rcnn在训练cnn时,就是借鉴了spp,通过引入roipooling layer,将用selective search得到的2K的regions通过roipooling layer映射到具体的patch上,类似于sppnet,然后每个patch分别进行分类和regression,这样就一次性完成了所有regions的分类和定位。fastrcnn既利用了sppnet在前面几层统一用conv和pooling对整图进行计算的计算资源节约的特征,又通过引入roipooling 层,将sppnet无法完成的整体cnn的ft完成了,同时引入了l1 norm对regression进行调整,做到了end-to-end.流程框架如下图,图里我少了一条线,roi的label应该是cls的loss的输入之一。

这篇文章看似内容没那么多,但是很重要,而且其实在细节的很多地方都值得借鉴,代码写的也是相当完美。
Multi-Objective Convolutional Learning for Face Labeling,其实是引入了单个pixel的loss,以及pixel之间的邻域loss,即引入了crf的两个energy,通过引入这两个loss完成对cnn的训练,但是在进行test时,并不用crf,使用graphcut完成分割。我个人觉得有点类似于fcn,但是fcn是单纯对pixel的分类,而本文通过引入crf,利用了pixel之间的关系,根据作者所说,这么做提高了不少。
Object detection via a multi-region & semantic segmentation-aware CNN model
本文我读了一下,有点类似于是sppnet,但是不同的是在生成特征时,把一个regions,通过不同方向的裁剪,得到很多个regions,而后这些regions分别得到特征,然后把这些特征通过spp统一到一个尺度,最后展开作为一个大特征,完成检测。而在分割时,直接用bbox作为正样本,而不需要那么严格的pixel级别的正样本,cnn能够对bbox带来的噪声具有鲁棒性。具体需要细看。
multibox,google的工作,整图作为输入,得到的是confidence和可能存在object的bbox位置,fastrcnn其实借鉴了这个思路。但是感觉google的工作很庞大,不知道能不能调试下来。
fcn,通过cnn,完成分割,这个工作的出现,引入了很多后续工作。
cnn-crf(deeplab),是cnn和crf分stage训练的,但是和别的思路不一样的地方是,crf在分割时起到作用了,而cnn的训练又没有用到crf。
最近就在不停的读文章和比较其中的差别了,其中可以分为两个路子,fastrcnn, multibox; fcn cnn-crf。
最近的阅读list的更多相关文章
- 【原】FMDB源码阅读(三)
[原]FMDB源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 FMDB比较优秀的地方就在于对多线程的处理.所以这一篇主要是研究FMDB的多线程处理的实现.而 ...
- 【原】FMDB源码阅读(二)
[原]FMDB源码阅读(二) 本文转载请注明出处 -- polobymulberry-博客园 1. 前言 上一篇只是简单地过了一下FMDB一个简单例子的基本流程,并没有涉及到FMDB的所有方方面面,比 ...
- 【原】FMDB源码阅读(一)
[原]FMDB源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 说实话,之前的SDWebImage和AFNetworking这两个组件我还是使用过的,但是对于 ...
- 【原】AFNetworking源码阅读(六)
[原]AFNetworking源码阅读(六) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 这一篇的想讲的,一个就是分析一下AFSecurityPolicy文件,看看AF ...
- 【原】AFNetworking源码阅读(五)
[原]AFNetworking源码阅读(五) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇中提及到了Multipart Request的构建方法- [AFHTTP ...
- 【原】AFNetworking源码阅读(四)
[原]AFNetworking源码阅读(四) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇还遗留了很多问题,包括AFURLSessionManagerTaskDe ...
- 【原】AFNetworking源码阅读(三)
[原]AFNetworking源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇的话,主要是讲了如何通过构建一个request来生成一个data tas ...
- 【原】AFNetworking源码阅读(二)
[原]AFNetworking源码阅读(二) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇中我们在iOS Example代码中提到了AFHTTPSessionMa ...
- 【原】AFNetworking源码阅读(一)
[原]AFNetworking源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 AFNetworking版本:3.0.4 由于我平常并没有经常使用AFNetw ...
- [PHP源码阅读]count函数
在PHP编程中,在遍历数组的时候经常需要先计算数组的长度作为循环结束的判断条件,而在PHP里面对数组的操作是很频繁的,因此count也算是一个常用函数,下面研究一下count函数的具体实现. 我在gi ...
随机推荐
- gitee 搭建自己的代码仓库
git是什么? 还是科普一下吧:Git是一个开源的分布式版本控制系统,可以有效.高速的处理从很小到非常大的项目版本管理(来自我大百度) 现在越来越多的公司已经使用git来进行项目的版本管理,,使用起来 ...
- Android NDK开发 Jni中打日志LOG(二)
HelloJni.c文件中,加入头文件和函数声明.最终文件如下: #include <jni.h> #include <string.h> #include<androi ...
- python get_dummies与cut离散化数据
- 3d Max 2013安装失败怎样卸载3dsmax?错误提示某些产品无法安装
AUTODESK系列软件着实令人头疼,安装失败之后不能完全卸载!!!(比如maya,cad,3dsmax等).有时手动删除注册表重装之后还是会出现各种问题,每个版本的C++Runtime和.NET f ...
- maya2012无法安装卸载激活失败
AUTODESK系列软件着实令人头疼,安装失败之后不能完全卸载!!!(比如maya,cad,3dsmax等).有时手动删除注册表重装之后还是会出现各种问题,每个版本的C++Runtime和.NET f ...
- Python 元组 (tuple)
作者博文地址:https://www.cnblogs.com/liu-shuai/ Python的元组与列表类似,同样可通过索引访问,支持异构,任意嵌套.不同之处在于元组的元素不能修改.元组使用小括号 ...
- Spring Boot实战(1) Spring基础
1. Spring基础配置 Spring框架本身有四大原则: 1) 使用POJO进行轻量级和最小侵入式开发 2) 通过依赖注入和基于接口编程实现松耦合 3) 通过AOP和默认习惯进行声明式编程 4) ...
- React.js 小书 Lesson3 - 前端组件化(二):优化 DOM 操作
作者:胡子大哈 原文链接:http://huziketang.com/books/react/lesson3 转载请注明出处,保留原文链接和作者信息. 看看上一节我们的代码,仔细留意一下 change ...
- 现有分布式技术(socket、.net remoting、asp.net webservice、WSE、ES)和wcf的比较及优势
1:socket VS remoting 使用socket无疑是效率最高的.但是,在复杂的接口环境下,socket的开发效率也是最低的.故在兼顾开发效率的情况下,可以使用remoting来代替sock ...
- EF删除数据
1.方法一,面向对象 using (MyDbContent content = new MyDbContent()) { content.Entry<UserInfo>(model).St ...