AlexeyAB DarkNet YOLOv3框架解析与应用实践（二）

版本3有什么新功能？

YOLOv3使用了一些技巧来改进训练和提高性能，包括：多尺度预测、更好的主干分类器等等。全部细节都在我们的论文上！

使用预先训练的模型进行检测

这篇文章将指导你通过使用一个预先训练好的模型用YOLO系统检测物体。如果你还没有安装Darknet，你应该先安装。或者不去阅读所有的东西：

git clone https://github.com/pjreddie/darknet

cd darknet

make

容易的！

在cfg/子目录中已经有YOLO的配置文件。你必须在这里下载预先训练的权重文件（237MB）。或者运行这个：

wget https://pjreddie.com/media/files/yolov3.weights

将看到如下输出：

layer filters size input output

0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs

1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs

.......

105 conv 255 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 255 0.353 BFLOPs

106 detection

truth_thresh: Using default '1.000000'

Loading weights from yolov3.weights...Done!

data/dog.jpg: Predicted in 0.029329 seconds.

dog: 99%

truck: 93%

bicycle: 99%

Darknet打印出它检测到的物体，它的可信度，以及找到它们所花的时间。我们没有用OpenCV编译Darknet，因此它不能直接显示检测结果。相反，它将它们保存在predictions.png中。您可以打开它来查看检测到的对象。因为我们在CPU上使用Darknet，所以每张图像大约需要6-12秒。如果我们使用GPU版本，速度会快得多。已经包括了一些例子图片，以防你需要灵感。尝试

data/eagle.jpg, data/dog.jpg, data/person.jpg, or data/horses.jpg!

detect命令是命令的更通用版本的简写。它相当于命令：

./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

如果您只想在一个图像上运行检测，则不需要知道这一点，但知道是否要执行其他操作（如在网络摄像头上运行）（稍后将看到）会很有用。

多帧图像

不要在命令行上提供图像，您可以将其留空以尝试一行中的多个图像。相反，当配置和权重完成加载时，您将看到一个提示：

./darknet detect cfg/yolov3.cfg yolov3.weights

layer filters size input output

0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs

1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs

.......

104 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs

105 conv 255 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 255 0.353 BFLOPs

106 detection

Loading weights from yolov3.weights...Done!

Enter Image Path:

输入像data/horses.jpg这样的图像路径，让它为该图像预测框。

完成后，它将提示您输入更多路径以尝试不同的图像。完成后，使用Ctrl-C退出程序。

更改检测阈值

默认情况下，YOLO只显示置信度为.25或更高的对象。可以通过将-thresh<val>标志传递给yolo命令来更改此值。例如，要显示所有检测，可以将阈值设置为0：

./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg -thresh 0

产生：

![[全部]

所以这显然不是非常有用，但是可以将其设置为不同的值来控制模型设置的阈值。 Tiny YOLOv3

我们有一个非常小的模型，也适用于约束环境，yolov3 tiny。要使用此模型，请首先下载权重：

wget https://pjreddie.com/media/files/yolov3-tiny.weights

然后使用Tiny配置文件和权重运行检测：

./darknet detect cfg/yolov3-tiny.cfg yolov3-tiny.weights data/dog.jpg

网络摄像头的实时检测

如果看不到结果，在测试数据上运行YOLO就不是很有趣了。与其在一堆图片上运行，不如在网络摄像头的输入上运行！

要运行这个演示，您需要使用CUDA和OpenCV编译Darknet。然后运行命令：

./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights

YOLO将显示当前FPS和预测类，以及在其上绘制边界框的图像。

你需要一个网络摄像头连接到OpenCV可以连接到的计算机，否则它将无法工作。如果您连接了多个网络摄像头，并且希望选择要使用的摄像头，则可以通过-c<num>标志进行选择（OpenCV默认使用网络摄像头0）。

如果OpenCV可以读取视频，也可以在视频文件上运行它：

./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights <video file>

这就是我们制作上述YouTube视频的方式。

在VOC上训练YOLO

如果你想使用不同的训练模式、超参数或数据集，你可以从头开始训练YOLO。下面是如何让它在Pascal VOC数据集上工作。

获取Pascal VOC数据

要训练YOLO，您需要2007年至2012年的所有VOC数据。你可以在这里找到数据的链接。要获取所有数据，请创建一个目录来存储所有数据，然后从该目录运行：

wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

wget https://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar

wget https://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar

tar xf VOCtrainval_11-May-2012.tar

tar xf VOCtrainval_06-Nov-2007.tar

tar xf VOCtest_06-Nov-2007.tar

现在将有一个VOCdevkit/子目录，其中包含所有VOC训练数据。

为VOC生成标签

现在我们需要生成Darknet使用的标签文件。Darknet希望为每个图像创建一个.txt文件，并为图像中的每个真实值对象创建一条线，如下所示：

其中x、y、宽度和高度与图像的宽度和高度相关。要生成这些文件，我们将在Darknet的script s/目录中运行voc_label.py脚本。我们再下载一次吧，因为我们很懒。

wget https://pjreddie.com/media/files/voc_label.py

python voc_label.py

几分钟后，此脚本将生成所有必需的文件。它主要在VOCdevkit/VOC2007/labels/和VOCdevkit/VOC2012/labels/中生成大量标签文件。在您的目录中，您应该看到：

2007_test.txt VOCdevkit

2007_train.txt voc_label.py

2007_val.txt VOCtest_06-Nov-2007.tar

2012_train.txt VOCtrainval_06-Nov-2007.tar

2012_val.txt VOCtrainval_11-May-2012.tar

文本文件如2007_train.txt列出了当年的图像文件和图像集。Darknet需要一个文本文件，其中包含所有要训练的图像。在这个例子中，让我们训练除了2007测试集之外的所有东西，以便我们可以测试我们的模型。运行：

cat 2007_train.txt 2007_val.txt 2012_*.txt > train.txt

现在我们把2007年的trainval和2012年的trainval都列在一个大名单上。这就是我们要做的数据设置！

修改Pascal数据的Cfg

现在找到的darknet目录。我们必须更改cfg/voc.data配置文件以指向您的数据：

1 classes= 20

2 train = <path-to-voc>/train.txt

3 valid = <path-to-voc>2007_test.txt

4 names = data/voc.names

5 backup = backup

您应该将<path to voc>替换为放置voc数据的目录。

下载预训练卷积权重

对于训练，我们使用在Imagenet上预先训练的卷积权重。我们使用darknet53模型的权重。你可以在这里下载卷积层的权重（76MB）。

wget https://pjreddie.com/media/files/darknet53.conv.74

训练模型

现在我们可以训练了！运行命令：

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74

在COCO上训练YOLO

如果你想使用不同的训练模式、超参数或数据集，你可以从头开始训练YOLO。下面是如何让它在COCO数据集上工作。

获取COCO数据

为了训练YOLO，你需要所有的COCO数据和标签。脚本scripts/get_coco_dataset.sh将为您执行此操作。找出要将COCO数据放在哪里并下载它，例如：

cp scripts/get_coco_dataset.sh data

cd data

bash get_coco_dataset.sh

现在您应该拥有为Darknet生成的所有数据和标签。

修改COCO的cfg

现在找到darknet目录。我们必须更改cfg/coco.data配置文件以指向您的数据：

1 classes= 80

2 train = <path-to-coco>/trainvalno5k.txt

3 valid = <path-to-coco>/5k.txt

4 names = data/coco.names

5 backup = backup

您应该用放置coco数据的目录替换<path to coco>。

您还应该修改模型cfg以进行训练，而不是测试。cfg/yolo.cfg应该如下所示：

[net]

# Testing

# batch=1

# subdivisions=1

# Training

batch=64

subdivisions=8

....

训练模型

现在我们可以训练了！运行命令：

./darknet detector train cfg/coco.data cfg/yolov3.cfg darknet53.conv.74

如果要使用多个GPU运行：

./darknet detector train cfg/coco.data cfg/yolov3.cfg darknet53.conv.74 -gpus 0,1,2,3

如果要从检查点停止并重新开始训练：

./darknet detector train cfg/coco.data cfg/yolov3.cfg backup/yolov3.backup -gpus 0,1,2,3

开放图像数据集上的YOLOv3

wget https://pjreddie.com/media/files/yolov3-openimages.weights

./darknet detector test cfg/openimages.data cfg/yolov3-openimages.cfg yolov3-openimages.weights

老yolo地址怎么了？

如果您使用的是YOLO版本2，您仍然可以在此处找到该网站：

https://pjreddie.com/darknet/yolov2/

引用

如果你在工作中使用YOLOv3，请引用我们的论文！

@article{yolov3,

title={YOLOv3: An Incremental Improvement},

author={Redmon, Joseph and Farhadi, Ali},

journal = {arXiv},

year={2018}

}

AlexeyAB DarkNet YOLOv3框架解析与应用实践（二）的更多相关文章

AlexeyAB DarkNet YOLOv3框架解析与应用实践（六）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(六) 1. Tiny Darknet 听过很多人谈论SqueezeNet. SqueezeNet很酷,但它只是优化参数计数.当大多数高 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（五）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(五) RNNs in Darknet 递归神经网络是表示随时间变化的数据的强大模型.为了更好地介绍RNNs,我强烈推荐Andrej K ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（四）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(四) Nightmare 从前,在一所大学的大楼里,西蒙尼亚.维达第和齐瑟曼有一个很好的主意,几乎和你现在坐的大楼完全不同.他们想,嘿 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（三）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(三) ImageNet分类您可以使用Darknet为1000级ImageNet挑战赛分类图像.如果你还没有安装Darknet,你应该 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（一）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(一) Darknet: C语言中的开源神经网络 Darknet是一个用C和CUDA编写的开源神经网络框架.它速度快,易于安装,支持C ...
mybatis 3.x源码深度解析与最佳实践（最完整原创）
mybatis 3.x源码深度解析与最佳实践 1 环境准备 1.1 mybatis介绍以及框架源码的学习目标 1.2 本系列源码解析的方式 1.3 环境搭建 1.4 从Hello World开始 2 ...
iScroll框架解析——Android 设备页面内 div（容器，非页面）overflow:scroll; 失效解决（转）
移动平台的活,兼容问题超多,今儿又遇到一个.客户要求在弹出层容器内显示内容,但内容条数过多,容器显示滚动条.按说是So easy,容器设死宽.高,CSS加属性 overflow:scroll; -we ...
.NET Core 多框架支持(net45+netstandard20)实践中遇到的一些问题总结
.NET Core 多框架支持(net45+netstandard20)实践中遇到的一些问题总结前言本文主要是关于.NET Standard 代码在多框架和多平台支持自己实践过程中遇到的一 ...
[转载]iOS 10 UserNotifications 框架解析
活久见的重构 - iOS 10 UserNotifications 框架解析 TL;DR iOS 10 中以前杂乱的和通知相关的 API 都被统一了,现在开发者可以使用独立的 UserNotifica ...

随机推荐

5. Linux常用命令
clear命令: 作用:清屏快捷键:Ctrl + L pwd命令: 作用:用于显示当前的工作路径位置(当前工作文件夹) 示例: $ pwd /home/tarena Linux/Unix下的路径: ...
07- HTTP协议详解及Fiddler抓包
HTTP协议简介-超文本传输协议 HTTP协议是请求/响应协议:客户端发送请求到服务器,服务器响应该请求.当前版本为1.1版本. HTTP协议特点 1.简单快速:客户向服务器请求服务时,只需传送请求方 ...
不可不知的CSS小技巧
一.表单部分 1.禁止textarea文本域的缩放 resize:none; 2.去除初始化textarea下拉条 overflow:auto; 3.如何让表单中的选项按钮,点击文字也能选中? < ...
RF-日期时间拼接（20191024_195355）
*** Test Cases *** testGetTime @{time}= Get Time year month day hour min sec ${sDate}= Catenate SEPA ...
【Nacos】Springboot整合Nacos配置中心(二) 多环境配置
本篇随笔接上一篇文章:Springboot整合Nacos配置中心(一),主要记录Nacos多环境的配置的方法 Nacos多环境的配置方法一: 1.在项目中的bootstrap.yaml文件中配置激活 ...
hdu1287 破译密码
题意: 破译密码 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Subm ...
Python脚本自动化破解大白鲨摄像头(Shodan)
关于本文的技术知识点,Shodan模块的用法,传送门--> Python中shadon模块的使用 Shodan的使用今天我们要利用python进行自动化破解的摄像头叫大白鲨摄像头,他的 ...
React-列表 & Key
<!DOCTYPE html> <html> <head> <meta charset="UTF-8" /> <title&g ...
JDBC相关配置和操作
获取数据库连接的几种方式 ps.数据库URL : String url = "jdbc:mysql://localhost:3306/dailytext?useSSL=false&s ...
webpack 快速入门系列 —— 初步认识 webpack
初步认识 webpack webpack 是一种构建工具 webpack 是构建工具中的一种. 所谓构建,就是将资源转成浏览器可以识别的.比如我们用 less.es6 写代码,浏览器不能识别 less ...

AlexeyAB DarkNet YOLOv3框架解析与应用实践（二）

AlexeyAB DarkNet YOLOv3框架解析与应用实践（二）的更多相关文章

随机推荐

热门专题