Yolo：实时目标检测实战（上）

YOLO：Real-Time Object Detection

你只看一次（YOLO）是一个最先进的实时物体检测系统。在帕斯卡泰坦X上，它以每秒30帧的速度处理图像，在COCO test-dev上有57.9%的mAP。

与其他探测器的比较，YOLOv3非常快速和准确。在0.5 IOU处测得的mAP中，YOLOv3与焦距损失相当，但速度快了约4倍。此外，可以轻松地权衡速度和准确性之间的简单改变模型的大小，无需再训练！

COCO数据集的性能

How it works

先前的检测系统重新利用分类器或定位器来执行检测。他们将模型应用于多个位置和比例的图像。图像的高分区域被认为是检测。

我们使用完全不同的方法。我们将单一的神经网络应用于完整的图像。该网络将图像分为多个区域，并预测每个区域的包围盒和概率。这些边界框由预测的概率加权。

与基于分类器的系统相比，我们的模型有几个优点。它在测试时查看整个图像，因此它的预测由图像中的全局上下文通知。与R-CNN这样的系统不同，R-CNN需要数千张图片才能得到一张图片。这使得它非常快，比R-CNN快1000倍，比R-CNN快100倍。有关完整系统的更多详细信息，请参阅我们的论文。

What is New in Version 3?

YOLOv3使用了一些技巧来改进训练和提高性能，包括：多尺度预测、更好的主干分类器等等。

Detection Using A Pre-Trained Model

这篇文章将指导你通过使用一个预先训练好的模型用YOLO系统检测物体。如果你还没有安装Darknet，你应该先安装。或者不去阅读所有的东西：

git clone https://github.com/pjreddie/darknet

cd darknet

make

容易的！

在cfg/子目录中已经有YOLO的配置文件。你必须在这里下载预先训练的权重文件（237MB）。或者运行这个：

wget https://pjreddie.com/media/files/yolov3.weights

Then run the detector!

可以看到下面的输出信息：

layer filters size input output

0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs

1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs

.......

105 conv 255 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 255 0.353 BFLOPs

106 detection

truth_thresh: Using default '1.000000'

Loading weights from yolov3.weights...Done!

data/dog.jpg: Predicted in 0.029329 seconds.

dog: 99%

truck: 93%

bicycle: 99%

Darknet打印出它检测到的物体，它的可信度，以及找到它们所花的时间。我们没有用OpenCV编译Darknet，因此它不能直接显示检测结果。相反，它将它们保存在predictions.png中。您可以打开它来查看检测到的对象。因为我们在CPU上使用Darknet，所以每张图像大约需要6-12秒。如果我们使用GPU版本，速度会快得多。

我已经包括了一些例子图片，以防你遇到困难。尝试

data/eagle.jpg, data/dog.jpg, data/person.jpg, or data/horses.jpg!

detect命令是命令的更通用版本的简写。它相当于命令：

./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

如果您只想在一个图像上运行检测，则不需要知道这一点，但知道是否要执行其他操作（如在网络摄像头上运行）（稍后将看到）会很有用。

Multiple Images

不要在命令行上提供图像，您可以将其留空以尝试一行中的多帧图像。相反，当配置和权重完成加载时，您将看到一个提示：

./darknet detect cfg/yolov3.cfg yolov3.weights

layer filters size input output

0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs

1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs

.......

104 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs

105 conv 255 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 255 0.353 BFLOPs

106 detection

Loading weights from yolov3.weights...Done!

Enter Image Path:

输入像data/horses.jpg这样的图像路径，让它为该图像预测框。

完成后，它将提示您输入更多路径以尝试不同的图像。完成后，使用Ctrl-C退出程序。更改检测阈值。

默认情况下，YOLO只显示置信度为.25或更高的对象。可以通过将-thresh<val>标志传递给yolo命令来更改此值。例如，要显示所有检测，可以将阈值设置为0：

./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg -thresh 0

产生：

![][all]

所以这显然不是非常有用，但是可以将其设置为不同的值来控制模型设置的阈值。 yolov3 tiny

我们有一个非常小的模型，也适用于约束环境，yolov3 tiny。要使用此模型，请首先下载权重：

wget https://pjreddie.com/media/files/yolov3-tiny.weights

然后使用微型配置文件和权重运行检测：

./darknet detect cfg/yolov3-tiny.cfg yolov3-tiny.weights data/dog.jpg

网络摄像头的实时检测

如果看不到结果，在测试数据上运行YOLO就不是很有趣了。与其在一堆图片上运行，不如在网络摄像头的输入上运行！

要运行这个演示，您需要使用CUDA和OpenCV编译Darknet。然后运行命令：

./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights

YOLO将显示当前FPS和预测类，以及在其上绘制边界框的图像。

你需要一个网络摄像头连接到OpenCV可以连接到的计算机，否则它将无法工作。如果您连接了多个网络摄像头，并且希望选择要使用的摄像头，则可以通过-c<num>标志进行选择（OpenCV默认使用网络摄像头0）。

如果OpenCV可以读取视频，也可以在视频文件上运行它：

./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights <video file>

这就是我们制作上述YouTube视频的方式。

训练YOLO学习VOC

如果你想使用不同的训练模式、超参数或数据集，你可以从头开始训练YOLO。下面是如何让它在Pascal VOC数据集上工作。

获取Pascal VOC数据

要训练YOLO，您需要2007年至2012年的所有VOC数据。你可以在这里找到数据的链接。要获取所有数据，请创建一个目录来存储所有数据，然后从该目录运行：

wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

wget https://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar

wget https://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar

tar xf VOCtrainval_11-May-2012.tar

tar xf VOCtrainval_06-Nov-2007.tar

tar xf VOCtest_06-Nov-2007.tar

现在将有一个VOCdevkit/子目录，其中包含所有VOC训练数据。

为VOC生成标签

现在我们需要生成Darknet使用的标签文件。Darknet希望为每个图像创建一个.txt文件，并为图像中的每个地面真实对象创建一条线，如下所示：

其中x、y、宽度和高度与图像的宽度和高度相关。要生成这些文件，我们将在Darknet的script s/目录中运行voc_label.py脚本。我们再下载一次吧，因为我们很懒。

wget https://pjreddie.com/media/files/voc_label.py

python voc_label.py

Yolo：实时目标检测实战（上）的更多相关文章

Yolo：实时目标检测实战（下）
Yolo:实时目标检测实战(下) YOLO:Real-Time Object Detection After a few minutes, this script will generate all ...
使用SlimYOLOv3框架实现实时目标检测
介绍人类可以在几毫秒内在我们的视线中挑选出物体.事实上,你现在就环顾四周,你将观察到周围环境并快速检测到存在的物体,并且把目光回到我们这篇文章来.大概需要多长时间? 这就是实时目标检测.如果我们能让 ...
YOLO2：实时目标检测视频教程，视频演示， Android Demo ，开源教学项目，论文。
实时目标检测和分类 GIF 图: 视频截图: 论文: https://arxiv.org/pdf/1506.02640.pdf https://arxiv.org/pdf/1612.08242.pdf ...
一文带你学会使用YOLO及Opencv完成图像及视频流目标检测（上）|附源码
计算机视觉领域中,目标检测一直是工业应用上比较热门且成熟的应用领域,比如人脸识别.行人检测等,国内的旷视科技.商汤科技等公司在该领域占据行业领先地位.相对于图像分类任务而言,目标检测会更加复杂一些,不 ...
TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程
运行步骤 1.从 YOLO 官网下载 YOLOv3 权重 wget https://pjreddie.com/media/files/yolov3.weights 下载过程如图: 2.转换 Darkn ...
【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作！
文章目录 1 目标检测简介 2 lmdb数据制作 2.1 VOC数据制作 2.2 lmdb文件生成 lmdb格式的数据是在使用caffe进行目标检测或分类时,使用的一种数据格式.这里我主要以目标检测为 ...
实战小项目之基于yolo的目标检测web api实现
上个月,对微服务及web service有了一些想法,看了一本app后台开发及运维的书,主要是一些概念性的东西,对service有了一些基本了解.互联网最开始的构架多是cs构架,浏览器兴起以后,变成了 ...
YOLO： 3 步实时目标检测安装运行教程 [你看那条狗，好像一条狗！]
封面图是作者运行图,我在 ubuntu 环境下只有文字预测结果. Detection Using A Pre-Trained Model 使用训练好的模型来检测物体运行一下命令来下载和编译模型 gi ...
SSD目标检测实战（TF项目）——人脸检测2
数据转化为VOC格式: 一.我们先看 VOC格式的数据是什么??? Annotations:存放xml 包括文件夹信息图片名称. 图片尺寸信息. 图片中object的信息. JPEGImage ...

随机推荐

软件篇-04-OMPL和FCL用于SLAM轨迹规划
使用OMPL内置的infoRRTstar算法模块和FCL碰撞检测库实现当前点和目标点的轨迹规划, 参考文章:https://www.cnblogs.com/shhu1993/p/7062099.htm ...
【Scrapy(一)】 Scrapy爬虫的基础执行流程
安装scrapy模块 : pip install scrapy 创建scrapy项目 1.scrapy startprojecty 项目名称注意:如果创建失败,可以先卸载原有的scrapy模块, ...
POJ 3301 三分（最小覆盖正方形）
题意: 给你n个点,让你找一个最小的正方形去覆盖所有点.思路: 想一下,如果题目中规定正方形必须和x轴平行,那么我们是不是直接找到最大的x差和最大的y差取最大就行了,但是这个题目 ...
Linux提权—脏牛漏洞(CVE-2016-5195)
目录脏牛漏洞 exp1复现: exp2复现: 脏牛漏洞脏牛漏洞,又叫Dirty COW,存在Linux内核中已经有长达9年的时间,在2007年发布的Linux内核版本中就已经存在此漏洞.Linux ...
FreeSql之Expression表达式拼接参数扩展
在FreeSql源码中Expression表达式拼接默认最多支持到5个泛型参数,当我们使用表关联比较多的时候,就需要进行扩展. 新建一个类,将命名空间改为System.Linq.Expressions ...
TCP的握手和挥手
三次握手三次握手具体过程是什么? 客户端发送一个数据包将SYN置成1,表示希望建立连接这个包中的序列号是X 服务器收到客户端发来的数据包通过SYN得知这是一个建立连接的请求于是发送一个响应包 ...
Servlet三大域对象
Servlet三大域对象的应用 request.session.application(ServletContext) ServletContext是一个全局的储存信息的空间,服务器开始就存在,服务器 ...
Markdown编辑器怎么用
Markdown编辑器怎么用 1.代码块快速创建一个代码块 // 语法: // ```+语言名称,如```java,```c++ 2.标题语法:#+空格+标题名字,一个#表示一级标题,两个#表示二 ...
LINQ之方法语法
上节讲到使用linq的查询关键字进行查询,这节讲一下linq查询的另一种方式--linq方法. 使用linq方法语法,必须要会用lambda表达式,配合lambda表达式才能体会到linq的优雅便捷. ...
关于Aborted connection告警日志的分析
前言: 有时候,连接MySQL的会话经常会异常退出,错误日志里会看到"Got an error reading communication packets"类型的告警.本篇文章我们 ...

Yolo：实时目标检测实战（上）

Yolo：实时目标检测实战（上）的更多相关文章

随机推荐

热门专题