YOLOV3中Darknet中cfg文件说明和理解

今天将要说明的是Darknet中的cfg文件，废话少说，直接干！（以cfg/yolov3.cfg为例，其它类似）

[net] ★ [xxx]开始的行表示网络的一层，其后的内容为该层的参数配置，[net]为特殊的层，配置整个网络

# Testing ★ #号开头的行为注释行，在解析cfg的文件时会忽略该行

# batch=1

# subdivisions=1

# Training

batch=64 ★ 这儿batch与机器学习中的batch有少许差别，仅表示网络积累多少个样本后进行一次BP

subdivisions=16 ★ 这个参数表示将一个batch的图片分sub次完成网络的前向传播

★★ 敲黑板：在Darknet中，batch和sub是结合使用的，例如这儿的batch=64，sub=16表示训练的过

程中将一次性加载64张图片进内存，然后分16次完成前向传播，意思是每次4张，前向传播的循环过程中

累加loss求平均，待64张图片都完成前向传播后，再一次性后传更新参数

★★★ 调参经验：sub一般设置16，不能太大或太小，且为8的倍数，其实也没啥硬性规定，看着舒服就好

batch的值可以根据显存占用情况动态调整，一次性加减sub大小即可，通常情况下batch越大越好，还需

注意一点，在测试的时候batch和sub都设置为1，避免发生神秘错误！

width=608 ★ 网络输入的宽width

height=608 ★ 网络输入的高height

channels=3 ★ 网络输入的通道数channels

★★★ width和height一定要为32的倍数，否则不能加载网络

★ 提示：width也可以设置为不等于height，通常情况下，width和height的值越大，对于小目标的识别

效果越好，但受到了显存的限制，读者可以自行尝试不同组合

momentum=0.9 ★ 动量 DeepLearning1中最优化方法中的动量参数，这个值影响着梯度下降到最优值得速度

decay=0.0005 ★ 权重衰减正则项，防止过拟合

angle=0 ★ 数据增强参数，通过旋转角度来生成更多训练样本

saturation = 1.5 ★ 数据增强参数，通过调整饱和度来生成更多训练样本

exposure = 1.5 ★ 数据增强参数，通过调整曝光量来生成更多训练样本

hue=.1 ★ 数据增强参数，通过调整色调来生成更多训练样本

learning_rate=0.001 ★ 学习率决定着权值更新的速度，设置得太大会使结果超过最优值，太小会使下降速度过慢。

如果仅靠人为干预调整参数，需要不断修改学习率。刚开始训练时可以将学习率设置的高一点，

而一定轮数之后，将其减小在训练过程中，一般根据训练轮数设置动态变化的学习率。

刚开始训练时：学习率以 0.01 ~ 0.001 为宜。一定轮数过后：逐渐减缓。

接近训练结束：学习速率的衰减应该在100倍以上。

学习率的调整参考https://blog.csdn.net/qq_33485434/article/details/80452941

★★★ 学习率调整一定不要太死，实际训练过程中根据loss的变化和其他指标动态调整，手动ctrl+c结

束此次训练后，修改学习率，再加载刚才保存的模型继续训练即可完成手动调参，调整的依据是根据训练

日志来，如果loss波动太大，说明学习率过大，适当减小，变为1/5，1/10均可，如果loss几乎不变，

可能网络已经收敛或者陷入了局部极小，此时可以适当增大学习率，注意每次调整学习率后一定要训练久

一点，充分观察，调参是个细活，慢慢琢磨

★★ 一点小说明：实际学习率与GPU的个数有关，例如你的学习率设置为0.001，如果你有4块GPU，那

真实学习率为0.001/4

burn_in=1000 ★ 在迭代次数小于burn_in时，其学习率的更新有一种方式，大于burn_in时，才采用policy的更新方式

max_batches = 500200 ★ 训练次数达到max_batches后停止学习，一次为跑完一个batch

policy=steps ★ 学习率调整的策略：constant, steps, exp, poly, step, sig, RANDOM，constant等方式

参考https://nanfei.ink/2018/01/23/YOLOv2%E8%B0%83%E5%8F%82%E6%80%BB%E7%BB%93/#more

steps=400000,450000

scales=.1,.1 ★ steps和scale是设置学习率的变化，比如迭代到400000次时，学习率衰减十倍，45000次迭代时，学

习率又会在前一个学习率的基础上衰减十倍

[convolutional] ★ 一层卷积层的配置说明

batch_normalize=1 ★ 是否进行BN处理，什么是BN此处不赘述，1为是，0为不是

filters=32 ★ 卷积核个数，也是输出通道数

size=3 ★ 卷积核尺寸

stride=1 ★ 卷积步长

pad=1 ★ 卷积时是否进行0 padding,padding的个数与卷积核尺寸有关，为size/2向下取整，如3/2=1

activation=leaky ★ 网络层激活函数

★★ 卷积核尺寸3*3配合padding且步长为1时，不改变feature map的大小

# Downsample

[convolutional] ★ 下采样层的配置说明

batch_normalize=1

filters=64

size=3

stride=2

pad=1

activation=leaky ★★ 卷积核尺寸为3*3，配合padding且步长为2时，feature map变为原来的一半大小

[shortcut] ★ shotcut层配置说明

from=-3 ★ 与前面的多少次进行融合，-3表示前面第三层

activation=linear ★ 层次激活函数

......

[convolutional] ★ YOLO层前面一层卷积层配置说明

size=1

stride=1

pad=1

filters=255 ★ filters=num(预测框个数)*(classes+5)，5的意义是4个坐标加一个置信率，论文中的tx,ty,tw,th,

c，classes为类别数，COCO为80,num表示YOLO中每个cell预测的框的个数，YOLOV3中为3

★★★ 自己使用时，此处的值一定要根据自己的数据集进行更改，例如你识别4个类，则：

filters=3*(4+5)=27,三个fileters都需要修改，切记

activation=linear

[yolo] ★ YOLO层配置说明

mask = 0,1,2 ★ 使用anchor的索引，0，1，2表示使用下面定义的anchors中的前三个anchor

anchors = 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326

classes=80 ★ 类别数目

num=9 ★ 每个grid cell总共预测几个box,和anchors的数量一致。当想要使用更多anchors时需要调大num

jitter=.3 ★ 数据增强手段，此处jitter为随机调整宽高比的范围，该参数不好理解，在我的源代码注释中有详细说明

ignore_thresh = .7

truth_thresh = 1 ★ 参与计算的IOU阈值大小.当预测的检测框与ground true的IOU大于ignore_thresh的时候，参与

loss的计算，否则，检测框的不参与损失计算。

★ 理解：目的是控制参与loss计算的检测框的规模，当ignore_thresh过于大，接近于1的时候，那么参与

检测框回归loss的个数就会比较少，同时也容易造成过拟合；而如果ignore_thresh设置的过于小，那么

参与计算的会数量规模就会很大。同时也容易在进行检测框回归的时候造成欠拟合。

★ 参数设置：一般选取0.5-0.7之间的一个值，之前的计算基础都是小尺度（13*13）用的是0.7，

（26*26）用的是0.5。这次先将0.5更改为0.7。参考：https://www.e-learn.cn/content/qita/804953

random=1 ★ 为1打开随机多尺度训练，为0则关闭

★★ 提示：当打开随机多尺度训练时，前面设置的网络输入尺寸width和height其实就不起作用了，width

会在320到608之间随机取值，且width=height，没10轮随机改变一次，一般建议可以根据自己需要修改

随机尺度训练的范围，这样可以增大batch，望读者自行尝试！

训练答疑

训练一次迭代的log 图1

疑问以及解决方案
如果你看到avg loss =nan 说明训练错误; 某一行的Class=-nan说明目标太大或者太小，某个尺度检测不到,属于正常
什么时候应该停止训练?	当loss不在下降或者下降极慢的情况可以停止训练，一般loss=0.7左右就可以了
在训练集上测试正确率很高，在其他测试集上测试效果很差，说明过拟合了。	提前停止训练，或者增大样本数量训练
如何提高目标检测正确率包括IOU，分类正确率	设置yolo层 random =1，增加不同的分辨率。或者增大图片本身分辨率。或者根据你自定义的数据集去重新计算anchor尺寸（darknet.exe detector calc_anchors data/obj.data -num_of_clusters 9 -width 416 -height 416 then set the same 9 anchors in each of 3 [yolo]-layers in your cfg-file）
如何增加训练样本？	样本特点尽量多样化，亮度，旋转，背景，目标位置，尺寸添加没有标注框的图片和其空的txt文件，作为negative数据
训练的图片较小，但是实际检测图片大，怎么检测小目标	1.使在用416416训练完之后，也可以在cfg文件中设置较大的width和height，增加网络对图像的分辨率，从而更可能检测出图像中的小目标，而不需要重新训练* 2. set `[route] layers = -1, 11` set ` [upsample] stride=4`
网络模型耗费资源多大？（我用过就两个）	[yolov3.cfg] [236MB COCO-91类] [4GB GPU-RAM] [yolov3.cfg] [194MB VOC-20类] [4GB GPU-RAM] [yolov3-tiny.cfg] [34MB COCO-91类] [1GB GPU-RAM] [yolov3-tiny.cfg] [26MB VOC-20类] [1GB GPU-RAM]
多GPU怎么训练	首先用一个gpu训练1000次迭代后的网络，再用多gpu训练 darknet.exe detector train data/voc.data cfg/yolov3-voc.cfg /backup/yolov3-voc_1000.weights -gpus 0,1,2,3
有哪些命令行来对神经网络进行训练和测试？	1.检测图片： build\darknet\x64\darknet.exe detector test data/coco.data cfg/yolov3.cfg yolov3.weights -thresh 0.25 xxx.jpg 2.检测视频：将test 改为 demo ; xxx.jpg 改为xxx.mp4 3.调用网络摄像头：将xxx.mp4 改为 http://192.168.0.80:8080/video?dummy=x.mjpg -i 0 4.批量检测：-dont_show -ext_output < data/train.txt > result.txt 5.手持端网络摄像头：下载mjpeg-stream 软件, xxx.jpg 改为 IP Webcam / Smart WebCam
如何评价模型好坏	build\darknet\x64\darknet.exe detector map data\defect.data cfg\yolov3.cfg backup\yolov3.weights 利用上面命令计算各权重文件，选择具有最高IoU（联合的交集）和mAP（平均精度）的权重文件

【. . . . . .本博客仅作个人生活、工作、学习等的日常记录。说明：（1）内容有参考其他博主、网页等，有因“懒”直接粘贴来，会备注出处。若遇雷同，或忘备注，并无故意抄袭之意，请诸“原主”谅解，很感谢您的辛勤"笔记"可供本人参考学习。（2）如遇同行，有参考学习者，因个人学识有限，不保证所写内容完全正确。您对本博文有任何的意见或建议，欢迎留言，感谢指正。（3）若您认为本主的全博客还不错，可以点击关注，便于互相学习。（4）感谢您的阅读，希望对您有一定的帮助。欢迎转载或分享，但请注明出处，谢谢。. . . . . .】

YOLOV3中Darknet中cfg文件说明和理解的更多相关文章

yolov3和darknet opencv版编译安装及基本测试
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 一.准备工作: 安装pkg-config:sudo apt-get install pkg-confi ...
Hibernate3中重复引用hbm文件错误信息记录
Hibernate3中重复引用hbm文件错误信息记录. 八月 ::, ERROR - Context initialization failed org.springframework.beans.f ...
GPU端到端目标检测YOLOV3全过程（中）
GPU端到端目标检测YOLOV3全过程(中) 计算机视觉初级部分知识体系总结了一下自己在计算机视觉初级部分的知识框架,整理如下. 个人所学并不全面( ...
Android中的 init.rc文件简介
init.rc脚本是由Android中linux的第一个用户级进程init进行解析的. init.rc 文件并不是普通的配置文件,而是由一种被称为"Android初始化语言"(An ...
C#窗体中读取修改xml文件
由于之前没有操作过xml文件,尤其是在窗体中操作xml,脑子一直转不动,而且很抵制去做这个功能,终于还是突破了自己通过查询资料完成了这个功能,在此记录一下自己的成果. 功能说明:程序中存在的xml文件 ...
用字符流实现每个文件夹中创建包含所有文件信息的readme.txt
package com.readme; import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; i ...
在文件夹中的指定类型文件中查找字符串（CodeBlocks+GCC编译，控制台程序，仅能在Windows上运行）
说明: 程序使用 io.h 中的 _findfirst 和 _findnext 函数遍历文件夹,故而程序只能在 Windows 下使用. 程序遍历当前文件夹,对其中的文件夹执行递归遍历.同时检查遍历到 ...
[转] - 在mac的终端中使用sublime打开文件
在mac的终端中使用sublime打开文件使用sublime提供的命令行工具.这个命令行工具位于 /Applications/Sublime\ Text\ 2.app/Contents/Shared ...
<实训|第十一天>学习一下linux中的进程，文件查找，文件压缩与IO重定向
[root@localhost~]#序言在今后的工作中,运维工程师每天的例行事务就是使用free -m,top,uptime,df -h...每天都要检查一下服务器,看看是否出现异常.那么今天我们就 ...

随机推荐

lspci - 列出所有PCI设备
总览 SYNOPSIS lspci [options] 描述 DESCRIPTION lspci 是一个用来显示系统中所有PCI总线设备或连接到该总线上的所有设备的工具. 为了能使用这个命令所有功能, ...
raft协议-分布式环境下的数据一致性问题
阅读了一个有意思的ppt,是Standford大学发表的raft协议网址:http://thesecretlivesofdata.com/raft/ 下面自己总结下咯: 1.raft是一个实现了解决 ...
MacOS Mojave 安装sshpass
使用sshpass的场景安装sshpass及各种常见小问题处理测试安全提示使用sshpass的场景在MacOS下使用ansible命令(inventory文件中使用了密码验证的方式)或者使用 ...
De Moivre–Laplace theorem
网址:https://en.wikipedia.org/wiki/De_Moivre%E2%80%93Laplace_theorem De Moivre–Laplace 中心极限定理的证明.主要用到s ...
最小可观(Minimal Observability Problem in Conjunctive Boolean Networks)
论文链接 1. 什么是 conjunctive Boolean network (CBN) 仅仅包含and运算. 下面这个式子为恒定更新函数 2. 什么是可观定义在时刻k是CBN的状态为 X(k) ...
linux c++下遍历文件
https://blog.csdn.net/u013617144/article/details/44807333
针对360浏览器读取不了cookie的问题
今天学习cookie的时候发现在360和谷歌浏览器下设置cookie打开是空白的!经过一番搜索才知道在本地是访问不了cookie只能在服务器端进行访问,但是仍然可以在火狐下进行访问
bzoj2802 [Poi2012]Warehouse Store 贪心+堆
题目传送门 https://lydsy.com/JudgeOnline/problem.php?id=2802 题解我一开始想到了一个比较麻烦的做法. 把每一天按照 \(b_i\) 从小到大排序,\ ...
POJ2942 UVA1364 Knights of the Round Table 圆桌骑士
POJ2942 洛谷UVA1364(博主没有翻墙uva实在是太慢了) 以骑士为结点建立无向图,两个骑士间存在边表示两个骑士可以相邻(用邻接矩阵存图,初始化全为1,读入一对憎恨关系就删去一条边即可),则 ...
CDMA原理
CDMA原理——特点 CDMA具有抗多径干扰.抗窄带干扰.抗认为干扰.抗多径延迟扩展的能力.同时有提高蜂窝系统的通信容量和便于模拟与数字体制的共存与过渡等优点.与TDMA技术形成强劲的竞争力. 与FD ...

YOLOV3中Darknet中cfg文件说明和理解

训练答疑

YOLOV3中Darknet中cfg文件说明和理解的更多相关文章

随机推荐

热门专题