在不同的服务器不同的机器上做过很多次实验,分别遇到各种不一样的错误并且跑通Py-Faster-RCNN,因此,在这里做一个流程的汇总:

一、下载文件:

首先,文件的下载可以有两种途径:

1、需要在官网上下载路径:https://github.com/rbgirshick/py-faster-rcnn

该方法的下载之后文件夹:py-faster-rcnn/caffe-fast-rcnn/下可能是空白:这个时候你是需要继续用命令行进行下载的

cd caffe-fast-rcnn
git submodule update --init --recursive

2、在Ubuntu下直接进行命令行的下载:(个人更推荐这一方法:比较稳定)

git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git

二、编译CAFFE:

1、下载完成后我们进入py-faster-rcnn//lib 文件下编译:

cd $FRCN_ROOT/lib
make

2、在py-faster-rcnn/caffe-fast-rcnn/文件路径下,下载Makefile.config文件:

链接网址:https://dl.dropboxusercontent.com/s/6joa55k64xo2h68/Makefile.config?dl=0

3、改变里面两个参数:(不改变的话后面的编译可以进行,但是跑到后面的demo 的时候会发现一大堆的头文件没有包含进来,如下图)

所以改变下面两个参数非常有必要:

# In your Makefile.config, make sure to have this line uncommented
WITH_PYTHON_LAYER := 1
# Unrelatedly, it's also recommended that you use CUDNN
USE_CUDNN := 1

4、编译caffe:

cd $FRCN_ROOT/caffe-fast-rcnn
make -j64

可能会出现错误,如下所示:

解决办法:进入自己根目录下原来的Caffe下面拷贝相应的文件进入caffe-fast-rcnn

1.将./include/caffe/util/cudnn.hpp 换成最新版的caffe里的cudnn的实现,即相应的cudnn.hpp.

2. 将./include/caffe/layers里的,所有以cudnn开头的文件,例如cudnn_conv_layer.hpp。   都替换成最新版的caffe里的相应的同名文件。

3.将./src/caffe/layer里的,所有以cudnn开头的文件,例如cudnn_lrn_layer.cu,cudnn_pooling_layer.cpp,cudnn_sigmoid_layer.cu。

都替换成最新版的caffe里的相应的同名文件。如下图所示:

继续上面工作:

编译成功!继续前面命令行的编译 :

make pycaffe

编译正确:继续后面步骤;

三、下载训练好的模型:

1、命令行下载:

cd $FRCN_ROOT
./data/scripts/fetch_faster_rcnn_models.sh

2、从ImageNet训练来的Caffe models (ZF, VGG16) pre-trained 模型下载命令(在SCRIPTS文件下包含下载的脚本,如果遇到错误一定是服务器上翻墙的问题)

./data/scripts/fetch_imagenet_models.sh

3、 从VOC 2007训练来的Faster R-CNN models trained 模型下载命令(同上)

./data/scripts/fetch_faster_rcnn_models.sh

4、设置好以上下载之后,我们的./data目录下会出现需要的模型:

四、跑通demo.py文件:

上面已经编译好了caffe并且下载做好了训练好的模型何必要数据:我们现在可以开始跑demo了:

cd $FRCN_ROOT
./tools/demo.py

跑通之后我们可以看到自己预测的图片的目标框:

五、我们不局限于跑通demo.py,我们需要了解demo.py文件里面的原理:

首先我们来切割demo.py文件里面的功能块:无非是:def vis_detections( ) 、def demo( ) 、def parse_args()

先来看一张功能解析图:

我们可以看到:demo.py文件的主流是黄色箭头、def vis_detections( ) 是紫色箭头、def demo( ) 是浅蓝色箭头、def parse_args() 是红棕色箭头。

随着箭头的延伸我们越来越深入了解里面的函数转换:其中:scores代表分数;boxes代表目标框对角两个点四个坐标值;dets代表各个框坐标和分数组成的矩阵、inds超过阈值符合要求的窗口对应的下标。

六、具体代码内容解释:

Po出一些详细的解释的手稿:

Ubuntu下跑通py-faster-rcnn、详解demo运作流程的更多相关文章

  1. 【Android 应用开发】Ubuntu 下 Android Studio 开发工具使用详解 (旧版本 | 仅作参考)

    . 基本上可以导入项目开始使用了 ... . 作者 : 万境绝尘 转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/21035637 ...

  2. Ubuntu下Git从搭建到使用详解

    Ubuntu下Git从搭建到使用详解 一.git的搭建 (1).sudo apt-get update (2).sudo apt-get -y install git 符:安装最新版本方法: add- ...

  3. 【Android 应用开发】Ubuntu 下 Android Studio 开发工具使用详解

    . 基本上可以导入项目开始使用了 ... . 作者 : 万境绝尘 转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/21035637 ...

  4. faster rcnn 详解

    转自:https://zhuanlan.zhihu.com/p/31426458 经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN ...

  5. [转]CNN目标检测(一):Faster RCNN详解

    https://blog.csdn.net/a8039974/article/details/77592389 Faster RCNN github : https://github.com/rbgi ...

  6. 物体检测丨Faster R-CNN详解

    这篇文章把Faster R-CNN的原理和实现阐述得非常清楚,于是我在读的时候顺便把他翻译成了中文,如果有错误的地方请大家指出. 原文:http://www.telesens.co/2018/03/1 ...

  7. Ubuntu下Apache+php+mysql网站架设详解

    目录 1 基础 2 安装 2.1 安装LAMP 2.2 图形化管理软件(可选) 2.2.1 安装webmin 2.2.2 安装phpmyadmin 3 配置文件路径 3.1 常用命令 3.2 配置ap ...

  8. Ubuntu下制作deb包的方法详解

    1  认识deb包 1.1   认识deb包 deb是Unix系统(其实主要是Linux)下的安装包,基于 tar 包,因此本身会记录文件的权限(读/写/可执行)以及所有者/用户组. 由于 Unix ...

  9. py faster rcnn+ 1080Ti+cudnn5.0

    看了py-faster-rcnn上的issue,原来大家都遇到各种问题. 我要好好琢磨一下,看看到底怎么样才能更好地把GPU卡发挥出来.最近真是和GPU卡较上劲了. 上午解决了g++的问题不是. 然后 ...

随机推荐

  1. 在EXCEL中如何同时冻结行与列?

    鼠标所在的单元格的位置 ,决定了你冻结的行和列.如: 冻结第一行与第一列, 只需要将鼠标置于单元格在第二列,第二行. 点击冻结

  2. Java中的Date类型无法赋值给数据库的datetime类型

    因为Java中new Date()的结果是"Thu Aug 27 19:03:54 CST 2020",而mysql中的datetime不接受这样的日期格式,插入数据会报错. 解决 ...

  3. gRPC Motivation and Design Principles | gRPC https://grpc.io/blog/principles/

    gRPC Motivation and Design Principles | gRPC https://grpc.io/blog/principles/

  4. Oracle 0至6级锁的通俗解释及实验案例_ITPUB博客 http://blog.itpub.net/30126024/viewspace-2156232/

    Oracle 0至6级锁的通俗解释及实验案例_ITPUB博客 http://blog.itpub.net/30126024/viewspace-2156232/

  5. What is the difference between btree and rtree indexing?

    https://softwareengineering.stackexchange.com/questions/113256/what-is-the-difference-between-btree- ...

  6. Page (computer memory) Memory segmentation Page table 虚拟地址到物理地址的转换

    A page, memory page, or virtual page is a fixed-length contiguous block of virtual memory, described ...

  7. 2021最新 Spring面试题精选(附刷题小程序)

    推荐使用小程序阅读 为了能让您更加方便的阅读 本文所有的面试题目均已整理至小程序<面试手册> 可以通过微信扫描(或长按)下图的二维码享受更好的阅读体验! 目录 推荐使用小程序阅读 1. S ...

  8. loj2587铁人两项

    无向图,图中选出定点三元组(a,b,c),a->b->c的路径没有重复边.问方案有多少? -------------------------------------------- 首先求出 ...

  9. COGS 307 模拟退火

    307. [HAOI2006] 均分数据 ★★   输入文件:data.in   输出文件:data.out   简单对比时间限制:3 s   内存限制:128 MB [问题描述] 已知N个正整数:A ...

  10. .htaccess 和 .user.ini

    .htaccess 仅能用于apache下,并且内容严格,不能有错误行,如:GIF89a .user.ini php 5.3.0开始引入,可设置除了:PHP_INI_SYSTEM 外的其他,包括(PH ...