Ubuntu下跑通py-faster-rcnn、详解demo运作流程
在不同的服务器不同的机器上做过很多次实验,分别遇到各种不一样的错误并且跑通Py-Faster-RCNN,因此,在这里做一个流程的汇总:
一、下载文件:
首先,文件的下载可以有两种途径:
1、需要在官网上下载路径:https://github.com/rbgirshick/py-faster-rcnn
该方法的下载之后文件夹:py-faster-rcnn/caffe-fast-rcnn/下可能是空白:这个时候你是需要继续用命令行进行下载的
cd caffe-fast-rcnn
git submodule update --init --recursive
2、在Ubuntu下直接进行命令行的下载:(个人更推荐这一方法:比较稳定)
git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git
二、编译CAFFE:
1、下载完成后我们进入py-faster-rcnn//lib 文件下编译:
cd $FRCN_ROOT/lib
make
2、在py-faster-rcnn/caffe-fast-rcnn/文件路径下,下载Makefile.config文件:
链接网址:https://dl.dropboxusercontent.com/s/6joa55k64xo2h68/Makefile.config?dl=0
3、改变里面两个参数:(不改变的话后面的编译可以进行,但是跑到后面的demo 的时候会发现一大堆的头文件没有包含进来,如下图)
所以改变下面两个参数非常有必要:
# In your Makefile.config, make sure to have this line uncommented
WITH_PYTHON_LAYER := 1
# Unrelatedly, it's also recommended that you use CUDNN
USE_CUDNN := 1
4、编译caffe:
cd $FRCN_ROOT/caffe-fast-rcnn
make -j64
可能会出现错误,如下所示:
解决办法:进入自己根目录下原来的Caffe下面拷贝相应的文件进入caffe-fast-rcnn
1.将./include/caffe/util/cudnn.hpp 换成最新版的caffe里的cudnn的实现,即相应的cudnn.hpp.
2. 将./include/caffe/layers里的,所有以cudnn开头的文件,例如cudnn_conv_layer.hpp。 都替换成最新版的caffe里的相应的同名文件。
3.将./src/caffe/layer里的,所有以cudnn开头的文件,例如cudnn_lrn_layer.cu,cudnn_pooling_layer.cpp,cudnn_sigmoid_layer.cu。
都替换成最新版的caffe里的相应的同名文件。如下图所示:
继续上面工作:
编译成功!继续前面命令行的编译 :
make pycaffe
编译正确:继续后面步骤;
三、下载训练好的模型:
1、命令行下载:
cd $FRCN_ROOT
./data/scripts/fetch_faster_rcnn_models.sh
2、从ImageNet训练来的Caffe models (ZF, VGG16) pre-trained 模型下载命令(在SCRIPTS文件下包含下载的脚本,如果遇到错误一定是服务器上翻墙的问题)
./data/scripts/fetch_imagenet_models.sh
3、 从VOC 2007训练来的Faster R-CNN models trained 模型下载命令(同上)
./data/scripts/fetch_faster_rcnn_models.sh
4、设置好以上下载之后,我们的./data目录下会出现需要的模型:
四、跑通demo.py文件:
上面已经编译好了caffe并且下载做好了训练好的模型何必要数据:我们现在可以开始跑demo了:
cd $FRCN_ROOT
./tools/demo.py
跑通之后我们可以看到自己预测的图片的目标框:
五、我们不局限于跑通demo.py,我们需要了解demo.py文件里面的原理:
首先我们来切割demo.py文件里面的功能块:无非是:def vis_detections( ) 、def demo( ) 、def parse_args()
先来看一张功能解析图:
我们可以看到:demo.py文件的主流是黄色箭头、def vis_detections( ) 是紫色箭头、def demo( ) 是浅蓝色箭头、def parse_args() 是红棕色箭头。
随着箭头的延伸我们越来越深入了解里面的函数转换:其中:scores代表分数;boxes代表目标框对角两个点四个坐标值;dets代表各个框坐标和分数组成的矩阵、inds超过阈值符合要求的窗口对应的下标。
六、具体代码内容解释:
Po出一些详细的解释的手稿:
Ubuntu下跑通py-faster-rcnn、详解demo运作流程的更多相关文章
- 【Android 应用开发】Ubuntu 下 Android Studio 开发工具使用详解 (旧版本 | 仅作参考)
. 基本上可以导入项目开始使用了 ... . 作者 : 万境绝尘 转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/21035637 ...
- Ubuntu下Git从搭建到使用详解
Ubuntu下Git从搭建到使用详解 一.git的搭建 (1).sudo apt-get update (2).sudo apt-get -y install git 符:安装最新版本方法: add- ...
- 【Android 应用开发】Ubuntu 下 Android Studio 开发工具使用详解
. 基本上可以导入项目开始使用了 ... . 作者 : 万境绝尘 转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/21035637 ...
- faster rcnn 详解
转自:https://zhuanlan.zhihu.com/p/31426458 经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN ...
- [转]CNN目标检测(一):Faster RCNN详解
https://blog.csdn.net/a8039974/article/details/77592389 Faster RCNN github : https://github.com/rbgi ...
- 物体检测丨Faster R-CNN详解
这篇文章把Faster R-CNN的原理和实现阐述得非常清楚,于是我在读的时候顺便把他翻译成了中文,如果有错误的地方请大家指出. 原文:http://www.telesens.co/2018/03/1 ...
- Ubuntu下Apache+php+mysql网站架设详解
目录 1 基础 2 安装 2.1 安装LAMP 2.2 图形化管理软件(可选) 2.2.1 安装webmin 2.2.2 安装phpmyadmin 3 配置文件路径 3.1 常用命令 3.2 配置ap ...
- Ubuntu下制作deb包的方法详解
1 认识deb包 1.1 认识deb包 deb是Unix系统(其实主要是Linux)下的安装包,基于 tar 包,因此本身会记录文件的权限(读/写/可执行)以及所有者/用户组. 由于 Unix ...
- py faster rcnn+ 1080Ti+cudnn5.0
看了py-faster-rcnn上的issue,原来大家都遇到各种问题. 我要好好琢磨一下,看看到底怎么样才能更好地把GPU卡发挥出来.最近真是和GPU卡较上劲了. 上午解决了g++的问题不是. 然后 ...
随机推荐
- 输入12V,输出12V的限流芯片
随着手机充电电流的提升,和设备的多样化,USB限流芯片就随着需求的增加而越来越多,同时为了更好的保护电子设备,需要进行一路或者多路的负载进行限流. USB限流芯片,5V输入 1, PW1502,常使用 ...
- React 入门-redux 和 react-redux
React 将页面元素拆分成组件,通过组装展示数据.组件又有无状态和有状态之分,所谓状态,可以简单的认为是组件要展示的数据.React 有个特性或者说是限制单向数据流,组件的状态数据只能在组件内部修改 ...
- JVM(五)手动解析.class文件
一:不同进制之间的转换 二进制:逢2进1,数字0-1. 八进制:逢8进1,数字0-7.三位二进制表示一位八进制.三位二进制最大为111,最大为7. 十进制:逢10进1,数字0-9.四位二进制表示一位十 ...
- Jmeter接口自动化测试系列之函数使用及扩展
介绍一下Jmeter自带函数的使用和 函数扩展,来满足测试工作中的各种需求! Jmeter自带函数 点击函数帮助助手图标,弹出函数助手框,可以选择各种各样的函数 举例: _Random 获取随机数,可 ...
- .NET 中依赖注入组件 Autofac 的性能漫聊
Autofac 是一款超赞的 .NET IoC 容器 ,在众多性能测评中,它也是表现最优秀的一个.它管理类之间的依赖关系, 从而使 应用在规模及复杂性增长的情况下依然可以轻易地修改.它的实现方式是将常 ...
- Python 代码的加密混淆
py 脚本编译成 c 文件(cython) 用 cython 将核心代码 py 模块文件转化成 .c 文件,再用 gcc 编译成 so(unix)文件,或者将其编译成 pyd(windows)文件. ...
- 后端API接口的错误信息返回规范
前言 最近我司要制定开发规范.在讨论接口返回的时候,后端的同事询问我们前端,错误信息的返回,前端有什么意见? 所以做了一些调研给到后端的同事做参考. 错误信息返回 在使用API时无可避免地会因为各种情 ...
- 聊一聊Axios与登录机制
前言 因为HTTP是一个stateless的协议,服务器并不会保存任何关于状态数据. 所以需要登录功能让服务器在以后请求的过程中能够识别到你的身份,而不是每次发请求都要输入用户名和密码. 下面介绍一下 ...
- MTO1804无刷电机引发的悲惨经历之二:电调固件刷新与优化
前言 原创文章,转载引用请务必注明链接,水平有限,如有疏漏,欢迎指正. 书接上回,我们总算是基本确认了黑衣神秘电调的身份,本文就尝试对电调固件进行一番设置,来个免费优化. 1.刷新固件 关于电调的固件 ...
- Spark JDBC系列--取数的四种方式
Spark JDBC系列--取数的四种方式 一.单分区模式 二.指定Long型column字段的分区模式 三.高自由度的分区模式 四.自定义option参数模式 五.JDBC To Other Dat ...