前言

疫情当下，出入医院等公共场所都被要求佩戴口罩。这篇博客将会介绍如何使用 Yolov4，训练一个人脸口罩检测模型（使用 Yolov4 的原因是目前只复现到了 v4 ），代码地址为 https://github.com/zhiyiYo/yolov4。

Yolov4

Yolov4 的神经网络结构相比 Yolov3 变化不是很大，主要更换了激活函数为 Mish，增加了 SPP 块和 PAN 结构（图源《yolo系列学习笔记----yolov4（SPP原理）》）。

感觉 Yolov4 最大的特点就是使用了一大堆的 Trick，比如数据增强方面使用了马赛克数据增强、Mixup 数据增强，将定位损失函数更换为 CIOU 损失。论文中提到了很多的 Trick，我的代码中没有全部复现，不过在 VOC2012 数据集训练了 160 个 epoch 之后 mAP 也能达到 83%，效果还是不错的。

可以在终端使用下述指令下载 Yolov4 的代码：

git clone https://github.com/zhiyiYo/yolov4.git

人脸口罩数据集

网上可以找到很多人脸口罩数据集，这里使用的是 AIZOOTech 提供的数据集。由于这个数据集的结构和 Pascal VOC 数据集不一样，所以重新组织一下数据集，并且修复和移除了数据集中的非法标签，可以在 Kaggle 上下载此数据集。目前这个数据集包含 6130 张训练图像，1839 张测试图像，对于 Yolov4 的训练来说应该是绰绰有余的。下载完数据集将其解压到 data 文件夹下。

在训练之前，我们需要使用 K-means 聚类算法对训练集中的边界框进行聚类，对于 416×416 的输入图像，聚类结果如下：

anchors = [

    [[100, 146], [147, 203], [208, 260]],

    [[26, 43], [44, 65], [65, 105]],

    [[4, 8], [8, 15], [15, 27]]

]

训练神经网络

训练目标检测模型一般都需要加载预训练的主干网络的权重，可以从谷歌云盘下载预训练好的权重 CSPDarknet53.pth 并将其放在 model 文件夹下。这里给出训练所用的代码 train.py，使用 python train.py 就能开始训练。模型会先冻结训练上 50 个 epoch，接着解冻训练 110 个 epoch：

# coding:utf-8

from net import TrainPipeline, VOCDataset

from utils.augmentation_utils import YoloAugmentation, ColorAugmentation

# 训练配置

config = {

    "n_classes": len(VOCDataset.classes),

    "image_size": 416,

    "anchors": [

        [[100, 146], [147, 203], [208, 260]],

        [[26, 43], [44, 65], [65, 105]],

        [[4, 8], [8, 15], [15, 27]]

    ],

    "darknet_path": "model/CSPdarknet53.pth",

    "lr": 1e-2,

    "batch_size": 8,

    "freeze_batch_size": 16,

    "freeze": True,

    "freeze_epoch": 50,

    "max_epoch": 160,

    "start_epoch": 0,

    "num_workers": 4,

    "save_frequency": 10,

    "no_aug_ratio": 0

}

# 加载数据集

root = 'data/FaceMaskDataset/train'

dataset = VOCDataset(

    root,

    'all',

    transformer=YoloAugmentation(config['image_size']),

    color_transformer=ColorAugmentation(config['image_size']),

    use_mosaic=True,

    use_mixup=True,

    image_size=config["image_size"]

)

if __name__ == '__main__':

    train_pipeline = TrainPipeline(dataset=dataset, **config)

    train_pipeline.train()

测试神经网络

训练完使用 python evals.py 可以测试所有保存的模型，evals.py 代码如下：

# coding:utf-8

import json

from pathlib import Path

import matplotlib as mpl

import matplotlib.pyplot as plt

from net import EvalPipeline, VOCDataset

mpl.rc_file('resource/theme/matlab.mplstyle')

# 载入数据集

root = 'data/FaceMaskDataset/val'

dataset = VOCDataset(root, 'all')

anchors = [

    [[100, 146], [147, 203], [208, 260]],

    [[26, 43], [44, 65], [65, 105]],

    [[4, 8], [8, 15], [15, 27]]

]

# 列出所有模型，记得修改 Yolo 模型文件夹的路径

model_dir = Path('model/2022-10-05_22-59-44')

model_paths = [i for i in model_dir.glob('Yolo_*')]

model_paths.sort(key=lambda i: int(i.stem.split("_")[1]))

# 测试所有模型

mAPs = []

iterations = []

for model_path in model_paths:

    iterations.append(int(model_path.stem[5:]))

    ep = EvalPipeline(model_path, dataset, anchors=anchors, conf_thresh=0.001)

    mAPs.append(ep.eval()*100)

# 保存数据

with open('eval/mAPs.json', 'w', encoding='utf-8') as f:

    json.dump(mAPs, f)

# 绘制 mAP 曲线

fig, ax = plt.subplots(1, 1, num='mAP 曲线')

ax.plot(iterations, mAPs)

ax.set(xlabel='iteration', ylabel='mAP', title='mAP curve')

plt.show()

得到的 mAP 曲线如下图所示，在第 120 个 epoch 达到最大值 94.14%：

下面使用一张真实图像看看训练效果如何，运行 demo.py：

# coding:utf-8

from net import VOCDataset

from utils.detection_utils import image_detect

# 模型文件和图片路径

model_path = 'model/Yolo_120.pth'

image_path = 'resource/image/三上老师.jpg'

# 检测目标

anchors = [

    [[100, 146], [147, 203], [208, 260]],

    [[26, 43], [44, 65], [65, 105]],

    [[4, 8], [8, 15], [15, 27]]

]

image = image_detect(model_path, image_path, VOCDataset.classes, anchors=anchors, conf_thresh=0.5)

image.show()

不错，效果非常好：

后记

至此，介绍完了训练 Yolov4 人脸口罩检测模型的过程，代码放在了 https://github.com/zhiyiYo/yolov4，以上~~

如何使用 Yolov4 训练人脸口罩检测模型的更多相关文章

K210,yolo，face_mask口罩检测模型训练及其在K210，kd233上部署
前段时间考研,再加上工作,时间很紧,一直没有更新博客,这几天在搞k210的目标检测模型,做个记录,遇到问题可以添加qq522414928或添加微信13473465975,共同学习首先附上github ...
PyTorch专栏（八）：微调基于torchvision 0.3的目标检测模型
专栏目录: 第一章:PyTorch之简介与下载 PyTorch简介 PyTorch环境搭建第二章:PyTorch之60分钟入门 PyTorch入门 PyTorch自动微分 PyTorch神经网络 P ...
微调torchvision 0.3的目标检测模型
微调torchvision 0.3的目标检测模型本文将微调在 Penn-Fudan 数据库中对行人检测和分割的已预先训练的 Mask R-CNN 模型.它包含170个图像和345个行人实例,说明如何 ...
人脸检测及识别python实现系列（5）——利用keras库训练人脸识别模型
人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型经过前面稍显罗嗦的准备工作,现在,我们终于可以尝试训练我们自己的卷积神经网络模型了.CNN擅长图像处理,keras库的te ...
基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型（二）
前言已完成数据预处理工作,具体参照: 基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型(一) 设置配置文件新建目录face_faster_rcn ...
dlib人脸关键点检测的模型分析与压缩
本文系原创,转载请注明出处~ 小喵的博客:https://www.miaoerduo.com 博客原文(排版更精美):https://www.miaoerduo.com/c/dlib人脸关键点检测的模 ...
Python 3 利用 Dlib 19.7 和 sklearn机器学习模型实现人脸微笑检测
0.引言利用机器学习的方法训练微笑检测模型,给一张人脸照片,判断是否微笑: 使用的数据集中69张没笑脸,65张有笑脸,训练结果识别精度在95%附近: 效果: 图1 示例效果工程利用pytho ...
ssd物体检测模型训练和测试总结
参考网址:github:https://github.com/naisy/realtime_object_detection 2018.10.16ssd物体检测总结:切记粗略地看一遍备注就开始训练模型 ...
用keras实现人脸关键点检测(2)
上一个代码只能实现小数据的读取与训练,在大数据训练的情况下.会造内存紧张,于是我根据keras的官方文档,对上一个代码进行了改进. 用keras实现人脸关键点检测数据集:https://pan.ba ...

随机推荐

Thread类的常用方法_获取线程名称的方法和Thread类的常用方法_设置线程名称的方法
构造方法: public Thread();分配一个新的线程对象 public Thread(String name);分配一个指定名字的新的线程对象 public Thread(Runnable t ...
python自带gui插件tkinter使用小结
1.tkinter简介 Tkinter(即 tk interface,简称"Tk")本质上是对 Tcl/Tk 软件包的 Python 接口封装,它是 Python 官方推荐的 GU ...
丽泽普及2022交流赛day15 社论
前言 link 太牛逼了,补完我一定放代码 . orz 越看越牛逼 orz . 时间复杂度都是口胡,不要信 . 以下是目录目录目录前言 A 题面题解代码 B 题面题解代码 C 题面题解 ...
[LNOI2022]盒
\(LNOI2022\)盒由于是加的形式,那么可以套路的拆贡献,枚举每条边的贡献就好了 \(40pts\) //比较显然的事情 //首先确定了一个B数组之后 //最小的移动应该是 //设左右两侧比原 ...
Vim基础用法，最常用、最实用的命令介绍（保姆级教程）
配置文件设置 set number (设置行号) set nocompatible (设置不兼容vi模式,不设置会导致许多vim特性被禁用) set clipboard=unnamed (设置普通的复 ...
程序员的专属浪漫——用3D Engine 5分钟实现烟花绽放效果
谁说程序员不懂浪漫? 作为程序员,用自己的代码本事手搓一个技术感十足的惊喜,我觉得,这是不亚于车马慢时代手写信的古典主义浪漫. 那么,应该怎样创作出具有自我身份属性的浪漫惊喜呢? 玩法很多,今天给大家 ...
【游记】CSP 2021 J2
这次是第一次参加CSP的复赛,所以考的就很LJ. \(DAY-\infty\) 到 \(DAY-14\) 知道了自己苟过了初赛,像个SB一样. (我初赛66分,旁边那位63.5,cao着线过去的) \ ...
Redis进阶篇：发布订阅模式原理与运用
"65 哥,如果你交了个漂亮小姐姐做女朋友,你会通过什么方式将这个消息广而告之给你的微信好友?" "那不得拍点女朋友的美照 + 亲密照弄一个九宫格图文消息在朋友圈发布大肆 ...
【python】pandas 索引操作
选择.修改数据(单层索引) 推荐使用.at..iat..loc..iloc 操作句法结果备注选择列 df[col] Series 基于列名(列的标签),返回Series 用标签选择行 df.l ...
ARC122D XOR Game（博弈论？字典树，贪心）
题面 ARC122D XOR Game 黑板上有 2 N 2N 2N 个数,第 i i i 个数为 A i A_i Ai. O I D \rm OID OID(OneInDark) 和 H I D ...

如何使用 Yolov4 训练人脸口罩检测模型

前言