YOLO3训练widerface数据集

因为YOLO３速度精度都很棒，所以想训练一下人脸模型，废话不多，进入正题

１写所有的配置文件

1.1 YOLO3-face.cfg

个人感觉YOLO的配置文件骑士和caffe差不多

在cfg/YOLO3.cfg的文件上改，生成自己的cfg/yolo3-face.cfg

 [net]

 # Testing

 # batch=

 # subdivisions=

 # Training

 batch=

 subdivisions=

 width=

 height=

 channels=

 momentum=0.9

 decay=0.0005

 angle=

 saturation = 1.5

 exposure = 1.5

 hue=.

其中:

batch=64 每batch个样本更新一次参数。

subdivisions=16 如果内存不够大，将batch分割为subdivisions个子batch，每个子batch的大小为batch/subdivisions。

训练的话把上面注释掉，测试就把训练部分的注释掉

学习率啥的就不改了，自己看着学吧

到配置文件底部更改最后的conv层参数

 [convolutional]

 batch_normalize=

 filters=

 size=

 stride=

 pad=

 activation=leaky

 [convolutional]

 batch_normalize=

 size=

 stride=

 pad=

 filters=

 activation=leaky

 [convolutional]

 size=

 stride=

 pad=

 filters=

 activation=linear

 [yolo]

 mask = ,,

 anchors = ,,  ,,  ,,  ,,  ,,  ,,  ,,  ,,  ,

 classes=

 num=

 jitter=.

 ignore_thresh = .

 truth_thresh =

 random=

多截取了一点，只要改最后一部分就可以，（友情提醒，ＹＯＬＯ里面这个模块有三处，都改，估计为了收敛用的辅助）

filter=３＊（４＋１＋classes）

classes=1

这里我的是人脸检测，so classes=1

下面的anchors懒得改了，理论上像我检测的人脸一般都是偏正方形，像（１６，３０）这种是没什么必要的

1.2 widerface.data

在cfg/voc.data基础上改

 classes=

 train  = /home/liuzg/yolo/darknet3/darknet/Pkj_face_scripts/train.txt

 valid  = /home/liuzg/yolo/darknet3/darknet/Pkj_face_scripts/test.txt

 names = data/widerface.names

 backup = backup

train和valid就是yolo需要的训练集和交叉训练集所需要的目录，后面讲生成方法

1.３ widerface.names

data/widerface.names　照抄coco.names格式，我这里检测人脸，整个文件只有一行face

2　数据集处理方法

记住你的唯一核心目的就是要生成上面1.2里面那两个txt文件，下面讲的所有方法都是辅助，你拿什么生成那两个文件和YOLO训练没有半毛钱关系

1 下载widerface数据集

2 转化成ＶＯＣ格式

我是按这位老兄的脚本搞得，新手拿这个上路其实还是有点坑的，先拿这个讲

https://blog.csdn.net/minstyrain/article/details/77986262

为什么讲他坑呢，因为他脚本里面第１２２行（可能我自己改过了，反正附近吧）

 filename=filename.replace("/","_")

他把文件路径名里面的路径给换了，后来也知道他为什么要换了，但是会有其他坑，所以记住核心目的就行，脚本不行，后面配合部分人工简单操作凑合过吧，go on

运行脚本后你得到了一个类似于ＶＯＣ格式的数据集

3 接下来看官网　https://pjreddie.com/darknet/yolo/

官网大神已经给你写好脚本了，把ＶＯＣ格式转化成ＹＯＬＯ格式

wget https://pjreddie.com/media/files/voc_label.py

python voc_label.py

当然我前面说了我们的是类ＶＯＣ格式，所以还是要改滴，讲不清，直接贴代码吧，反正也就是各种路径找不到的问题，还有上面转ＶＯＣ格式的时候，

那老哥好像还把一部分不好的数据给删了，所以并不是所有widerface数据都在ＶＯＣ格式里面

 import xml.etree.ElementTree as ET

 import pickle

 import os

 import re

 from os import listdir, getcwd

 from os.path import join

 sets=[('trainval'), ('test')]

 classes = ["face"]

 def convert(size, box):

     dw = 1./(size[0])

     dh = 1./(size[1])

     x = (box[0] + box[1])/2.0 - 1

     y = (box[2] + box[3])/2.0 - 1

     w = box[1] - box[0]

     h = box[3] - box[2]

     x = x*dw

     w = w*dw

     y = y*dh

     h = h*dh

     return (x,y,w,h)

 def convert_annotation(image_id):

     image_id_chage=image_id.replace('/','_')

     dirname=image_id[:image_id.find('/')]

     if not os.path.exists('wider-faces/labels/%s/'%(dirname)):

         os.makedirs('wider-faces/labels/%s/'%(dirname))

     in_file = open('wider-faces/Annotations/%s.xml'%(image_id_chage))

     out_file = open('wider-faces/labels/%s.txt'%(image_id), 'w')

     tree=ET.parse(in_file)

     root = tree.getroot()

     size = root.find('size')

     w = int(size.find('width').text)

     h = int(size.find('height').text)

     for obj in root.iter('object'):

         difficult = obj.find('difficult').text

         cls = obj.find('name').text

         if cls not in classes or int(difficult)==1:

             continue

         cls_id = classes.index(cls)

         xmlbox = obj.find('bndbox')

         b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))

         bb = convert((w,h), b)

         out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

 wd = getcwd()

 for image_set in sets:

     if not os.path.exists('wider-faces/labels/'):

         os.makedirs('wider-faces/labels/')

     image_ids = open('wider-faces/ImageSets/Main/%s.txt'%(image_set)).read().strip().split()

     list_file = open('%s.txt'%(image_set), 'w')

     for image_id in image_ids:

         if not os.path.exists('wider-faces/Annotations/%s.xml'%(image_id)):

             continue

         image_id=image_id[:image_id.find(re.findall("\d",image_id)[0],4)-1]+'/'+image_id[image_id.find(re.findall("\d",image_id)[0],4):]

         list_file.write('%s/wider-faces/WIDER_%s/images/%s.jpg\n'%(wd, image_set, image_id))

         convert_annotation(image_id)

     list_file.close()

 os.system("cat trainval.txt > train.txt")

 os.system("cat trainval.txt test.txt > train.all.txt")

估计我的要直接用也难，讲一下要改的地方吧

官网大神分三类，训练集，交叉集，测试集，我这里只有训练集trainval，交叉集test，不要问我为什么名字不对应，我自己也被搞了半天，烦死了

convert_annatation函数就是把ＶＯＣ的标记坐标格式转成ＹＯＬＯ认识的格式，中间我多了一个image_id_change就是因为上面那老哥把"/"换成"_"了，各种路径找不到

最后呢还需要一点人工操作

把widerface/labels复制拷贝到WINDER_trainval和WINDER_test下面，ok，到此为止，假设你一切顺利的话就可以训练了

3 官网下个预训练模型，把上面配置文件1.2里面的两个路径改成你自己的，训练吧，小伙子

YOLO3训练widerface数据集的更多相关文章

Fast RCNN 训练自己数据集 (1编译配置)
FastRCNN 训练自己数据集 (1编译配置) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https:/ ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
使用py-faster-rcnn训练VOC2007数据集时遇到问题
使用py-faster-rcnn训练VOC2007数据集时遇到如下问题: 1. KeyError: 'chair' File "/home/sai/py-faster-rcnn/tools/ ...
YOLOV4在linux下训练自己数据集（亲测成功）
最近推出了yolo-v4我也准备试着跑跑实验看看效果,看看大神的最新操作这里不做打标签工作和配置cuda工作,需要的可以分别百度搜索 VOC格式数据集制作,cuda和cudnn配置我们直接利用 ...
Scaled-YOLOv4 快速开始，训练自定义数据集
代码: https://github.com/ikuokuo/start-scaled-yolov4 Scaled-YOLOv4 代码: https://github.com/WongKinYiu/S ...
win10 下的YOLOv3 训练 wider_face 数据集检测人脸
1.数据集下载 (1)wider_face 数据集网址为 http://shuoyang1213.me/WIDERFACE/index.html 下载以上几项文件(这里推荐 google Drive ...
Fast RCNN 训练自己数据集 (2修改数据读取接口)
Fast RCNN训练自己的数据集 (2修改读写接口) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ http ...
【Mxnet】----1、使用mxnet训练mnist数据集
使用自己准备的mnist数据集,将0-9的bmp图像分别放到0-9文件夹下,然后用mxnet训练. 1.制作rec数据集 (1).制作list

随机推荐

Micro Python：运行在微控制器上的Python
Micro Python运行在微控制器上的Python.遵守MIT协议.由剑桥大学的理论物理学家乔治·达明设计.和Arduino类似,但Micro Python更强大. Micro Python的软件 ...
用python实现入门级NLP
今天看到一篇博文,是讲通过python爬一个页面,并统计页面词频的脚本,感觉蛮有意思的 Python NLP入门教程:http://python.jobbole.com/88874/ 本文简要介绍Py ...
share初始化
要看懂share先看与map的交互以及跨地图的交互 share初始化 void Share::ShareInit(I_DataLayer* data_layer) { // 加载xls表 if(!Lo ...
修改linux的hostname (修改linux系统的IP和hostname)
# vi /etc/sysconfig/networkNETWORKING=yesHOSTNAME=yourname //在这修改hostnameNISDOMAIN=eng-cn.platform.c ...
【题解】[APIO2009]会议中心
[题解][P3626 APIO2009]会议中心真的是一道好题!!!刷新了我对倍增浅显的认识. 此题若没有第二份输出一个字典序的方案,就是一道\(sort+\)贪心,但是第二问使得我们要用另外的办法 ...
一起来学linux：进程
简单来说,每当执行一个程序或者命令,启动事件的时候都会得到一个PID,也就是进程ID.比如用户登陆的时候就会得到一个PID.如下所示.两个用户zhf和root在登陆后分别获得PID 3212和3214 ...
蓝牙 CTS 测试
安装蓝牙测试安装包之后 . 安卓包名字 android-cts-6.0_r19-linux_x86-x86.zip 解压之后 /cts/android-cts/tools/ 目录下运行 ./ ...
centos下更换默认的python版本
1.在命令行输入python查看版本 2.到官网下载自己的python版本 wget https://www.python.org/ftp/python/3.5.1/Python-3.5.1.tgz ...
《高性能Javascript》 Summary（二）
第四章.算法和流程控制 Algorithms And Flow Control 原因:代码整体结构是执行速度的决定因素之一.代码量少不一定运行速度快,代码量多不一定运行速度慢.性能损失与组织代码和具体 ...
Android环境下通过C框架层控制WIFI【转】
本文转载自:https://blog.csdn.net/edw200/article/details/52192631 本人是从事Linux嵌入式开发的,安卓wifi控制在安卓JAVA层已经做得非常成 ...

YOLO3训练widerface数据集

YOLO3训练widerface数据集的更多相关文章

随机推荐

热门专题