Yolov3 的 OneFlow 实现

1.简介

YOLO 系列的算法(经典的v1~v3)，是单阶段目标检测网络的开山鼻祖，YOLO—You only look once，表明其单阶段的特征，正是由于网络简单，单阶段的效率较快，使其区别于 Faster-RCNN 为代表的两阶段目标检测器，从一开始推出至今，便以速度快和较高的准确率而风靡目标检测领域，受到广泛使用和好评。

而Yolov3是其中的经典和集大成者(当然官方最近也推出了 Yolov4 )，其以融合了残差网络的 Darknet-53 为骨干网络，融合了多尺度，3路输出的 feature map，上采样等特点，使其模型精度和对小目标检测能力都大为提升。

本文，提供了 Yolov3 的 OneFlow 版实现，和其他版本实现的区别在于，将输出特征的 nms 过程写进了 C++ 代码中，通过自定义 user op 的方式来调用，当然，也同时支持直接使用 python 代码处理 nms。

2.快速开始

开始前，确保已正确安装了oneflow，并且在python3环境下可以成功import oneflow。

git clone 此仓库到本地

git clone --recursive https://github.com/Oneflow-Inc/oneflow_yolov3.git

2. 安装 python 依赖库

pip install -r requirements.txt

3. 在项目 root 目录下，执行:

./scripts/build.sh

执行此脚本，将 cpp 代码中自定义的 op 算子编译成可调用执行的 .so 文件，将在项目路径下看到：

libdarknet.so
liboneflow_yolov3.so

预训练模型

使用了 Yolov3 原作者提供的预训练模型—yolov3.weight ，经转换后生成了 OneFlow 格式的模型。下载预训练模型：of_model_yolov3.zip ，并将解压后的 of_model 文件夹放置在项目 root 目录下，即可使用。

3. 预测/推理

运行：

sh yolo_predict.sh

或者：

sh yolo_predict_python_data_preprocess.sh

运行脚本后，将在 data/result 下生成检测后带 bbox 标记框的图片：

参数说明 - --pretrained_model 预训练模型路径

--label_path coco 类别标签路径(coco.name)
--input_dir 待检测图片文件夹路径
--output_dir 检测结构输出路径
--image_paths 单个/多个待检测图片路径，如：

--image_paths 'data/images/000002.jpg' 'data/images/000004.jpg'

训练同样很简单，准备好数据集后，只需要执行：sh yolo_train.sh即可，数据集制作过程见下文【数据集制作】部分。

4. 数据集制作

Yolov3 支持任意目标检测数据集，下面以 COCO2014 制作过程为例，介绍训练/验证所需的数据集制作，其它数据集如 PASCAL VOC 或自定义数据集等，都可以采用相同格式。

资源文件

下载 COCO2014 训练集和验证集图片，将解压后的 train2014 和 val2014 放在 data/COCO/images 目录下

（如果本地已下载过 COCO2014 数据集，可以 ln 软链接 images 至本地 train2014 和 val2014 的父目录）

准备资源文件：labels，5k.part，trainvalno5k.part

wget -c https://pjreddie.com/media/files/coco/5k.part

wget -c https://pjreddie.com/media/files/coco/trainvalno5k.part

wget -c https://pjreddie.com/media/files/coco/labels.tgz

脚本

在 data/COCO 目录下执行脚本：

# get label file

tar xzf labels.tgz

# set up image list

paste <(awk "{print \"$PWD\"}" <5k.part) 5k.part | tr -d '\t' > 5k.txt

paste <(awk "{print \"$PWD\"}" <trainvalno5k.part) trainvalno5k.part | tr -d '\t' > trainvalno5k.txt

# copy label txt to image dir

find labels/train2014/ -name "*.txt" | xargs -i cp {} images/train2014/

find labels/val2014/ -name "*.txt" | xargs -i cp {} images/val2014/

执行脚本将自动解压缩 labels.tgz 文件，并在当前目录下生成 5k.txt 和 trainvalno5k.txt，然后将 labels/train2014 和 labels/val2014 的所有 label.txt 文件复制到对应的训练集和验证集文件夹中( 保证图片和 label 在同一目录 )。

至此，完成整个数据集的准备过程。

5.训练

修改 yolo_train.sh 脚本中的参数，令：--image_path_file="data/COCO/trainvalno5k.txt" 并执行：

sh yolo_train.sh

即可开始训练过程，更详细的参数介绍如下：

--gpu_num_per_node 每台机器使用的gpu数量
--batch_size 批大小
--base_lr 初始学习率
--classes 目标类别数量（COCO 80；VOC 20）
--model_save_dir 模型存放文件夹路径
--dataset_dir 训练/验证集文件夹路径
--num_epoch 迭代总轮数
--save_frequency 指定模型保存的epoch间隔

说明

目前如果调用 yolo_predict.sh 执行，数据预处理部分对 darknet 有依赖

其中：

predict decoder 中调用 load_image_color、letterbox_image 函数

train
decoder 中调用 load_data_detection 函数

主要涉及以下操作，在后续的版本中会使用 OneFlow
decoder ops 替换

image read
nhwc -> nchw
image / 255
bgr2rgb
resize_image
fill_image
random_distort_image
clip image
random flip image and box
randomize_boxes
correct_boxes

Yolov3 的 OneFlow 实现的更多相关文章

项目版本与分支管理之阿里AoneFlow模式分析
前言在我前期的项目管理的经验中,一个项目需要维护多个产品及多个版本,这给版本与分支的管理增加了难度.前期没有重视,使得分支太多太乱,版本也没记录好,引发了很多的问题.在多种分支与版本的管理模式下,最 ...
模型转换[yolov3模型在keras与darknet之间转换]
首先借助qqwweee/keras-yolo3中的convert.py和tensorrt例子yolov3_onnx,并重新编写了代码,实现将darknet格式的yolov3的yolov3.cfg和yo ...
yolov3和darknet opencv版编译安装及基本测试
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 一.准备工作: 安装pkg-config:sudo apt-get install pkg-confi ...
基于YOLOv3和Qt5的车辆行人检测（C++版本）
概述 YOLOv3: 车辆行人检测算法 GitHub Qt5: 制作简单的GUI OpenCV:主要用于putText.drawRec等 Step YOLOv3检测结果 Fig 1. input im ...
利用YOLOV3训练自己的数据
写在前面:YOLOV3只有修改了源码才需要重新make,而且make之前要先make clean. 一.准备数据在/darknet/VOCdevkit1下建立文件夹VOC2007. voc2007文 ...
YOLOv3：训练自己的数据（附优化与问题总结）
环境说明系统:ubuntu16.04 显卡:Tesla k80 12G显存 python环境: 2.7 && 3.6 前提条件:cuda9.0 cudnn7.0 opencv3.4. ...
第十一节，利用yolov3训练自己的数据集
1.环境配置 tensorflow1.12.0 Opencv3.4.2 keras pycharm 2.配置yolov3 下载yolov3代码:https://github.com/qqwweee/k ...
AI佳作解读系列(二)——目标检测AI算法集杂谈：R-CNN，faster R-CNN，yolo，SSD，yoloV2，yoloV3
1 引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...
目标检测网络之 YOLOv3
本文逐步介绍YOLO v1~v3的设计历程. YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这 ...

随机推荐

java面试一日一题：binlog undolog redolog的区别
问题:请讲下mysql中binlog.undolog.redolog三种日志的区别分析:mysql中这三种日志很常见,也是面试中涉及比较多的方面,要理解清楚这三种日志的定位及区别: 回答要点: 主要 ...
一份释放root文件的脚本文件
#!/system/bin/sh MYDIR=$3 ARGS=$4 SU=$MYDIR/au SUPOLICY=$MYDIR/supolicy BUSYBOX=$MYDIR/busybox TOOLB ...
LNMP环境搭建Wordpress博客
目录 LNMP架构工作原理 yum源安装网站源包安装 LNMP是Linux Nginx MySQL/MariaDB Php/perl/python 的简称,是近些年才逐渐发展起来的构架,发展非常迅 ...
POJ1042 贪心钓鱼
题意: 你有H小时(H*12个单位)时间去用,有n个鱼池在一条直线上,一开始你在1的位置,可以选择在某些鱼池上钓鱼,但是如果持续在一个鱼池上钓鱼钓鱼速度回成线性减少,初始每个时间单位钓fi ...
Windows XP sp3 系统安装 Windbg 符号文件 Symbols 时微软失去支持的解决方案
0x01 前言 Windbg 是微软的正宗调试器,在正常的情况下调试一些程序并没有什么问题,但是如果需要调试分析程序的堆栈,或者是一些特殊的功能时则需要微软的符号文件的支持,所以符号文件是非常重要的, ...
JVM虚拟机-运行时数据区概述
目录运行时数据区域总览概念扫盲什么是栈帧(Stack Frame) JVM常见出现两种错误程序计数器虚拟机栈结构局部变量表方法是如何调用的本地方法栈堆浅堆和深堆堆的细分方法 ...
对标印度的PostMan，一款中国接口测试软件的崛起
对于我们开发者,Api接口调试一定不陌生.包括我在内,之前进行Api调试时,一直使用的是一款印度的软件Postman.记得刚入手的时候,由于该款软件缺乏中文版本,上手一直比较慢,而且还至少存在如下几个 ...
linux远程下载文件的两种方法之 ftp命令和scp命令
ftp命令: 服务器有安装ftp Server,另外一台linux可以使用ftp的client程序来进行文件的拷贝读取和下载. 1. 连接ftp服务器格式:ftp [hostname| ip-ad ...
Jenkins 基础篇 - 任务分类
从前面的小节中我们看到在创建 Jenkins 任务的时候有好几种类型,如果你专门安装了 Maven 相关插件,可能还会有一个[构建一个 maven 项目]的任务类型,那这些任务类型究竟有何区别,以及我 ...
《前端运维》一、Linux基础--02用户与权限
其实说真的,这些基础挺枯燥的,内容呢绝大多数都是些静态的. 上一篇文章我们学习了基本的指令和vim编辑器的操作方法.这篇文章我们主要来学习下Linux中用户的概念和权限相关的知识. 一.用户与用户组 ...

Yolov3 的 OneFlow 实现

Yolov3 的 OneFlow 实现的更多相关文章

随机推荐

热门专题