Python小组作业：基于yolov5的口罩佩戴识别

Python老师给了三个小组项目：1.自身专业问题 2.人工智能 3.游戏或者小工具

提前告知了，写游戏不好拿高分，小工具又不能展示自己的水平。大一刚来也没碰到什么专业问题，于是经过讨论，决定了做人工智能项目。

又因才疏学浅，只好践行拿来主义，把现成的yolov5拿来用，做一个口罩佩戴识别。

1.环境配置：本项目使用miniconda + pytorch + yolov5，IDE使用的是Pycharm。

miniconda官网：https://conda.io/en/latest/miniconda.html

pytorch官网：https://pytorch.org/get-started/locally/

Pycharm官网：https://www.jetbrains.com/pycharm/download/#section=windows

miniconda配置pytorch教程：https://blog.csdn.net/weixin_41297324/article/details/109478948

Pycharm安装教程：https://www.runoob.com/w3cnote/pycharm-windows-install.html

Anaconda可以虚拟化管理python环境，自带许多科学计算的python库。这是个非常方便的选择，也为后面封装exe挖了个坑。

不使用conda配置pytorch教程：https://blog.csdn.net/qq_23013309/article/details/103965619

Yolov5项目地址：https://github.com/ultralytics/yolov5

python版本是3.8，cuda版本我选择的是11.3，yolov5使用的是v6.0版本。

2.收集数据、打标签

训练人工智能是很吃数据的，推荐的数据规模是每一类1000+图片，因为是小组项目，所以采用的是小数据集。

目标数据部分来自：https://www.bilibili.com/video/BV1i7411376y

背景数据来自我手机相册、朋友圈。

打标签工具Labelimg：https://github.com/tzutalin/labelImg

将所有数据进行打标签，过程应当是十分痛苦的。

3.调整代码训练数据

yolov5-v6.0下载解压后，找到train.py，对其中代码进行修改。

parser.add_argument('--weights', type=str, default=ROOT / 'yolov5s.pt', help='initial weights path')

选择预训练的模型，如果数据集足够大，不选择预训练模型也可以取得很好的成果。

parser.add_argument('--epochs', type=int, default=100)

训练次数，这里默认是300，因为性能有限所以选择了100.

parser.add_argument('--batch-size', type=int, default=3, help='total batch size for all GPUs')

default需要根据显卡和内存性能修改，电脑是GTX3060+16G内存，我这里设置的比较保守。如果设置过大，会导致显存溢出。

其他的配置可以保持默认，直接把数据和标签扔进coco128的train2017文件夹中进行训练即可。

找到coco128.yaml，对其中的代码进行修改：

` # Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]

path: ../datasets/coco128 # dataset root dir

train: images/train2017 # train images (relative to 'path') 128 images

val: images/train2017 # val images (relative to 'path') 128 images

test: # test images (optional)

# Classes

nc: 2  # number of classes

names: ['masked','no_mask']  # class names`

nc改成2，names改为masked no_mask。

4.运行train.py，训练模型。

5.修改并调用detect.py

在yolov5的文件夹下新建一个mask_kid.py，内容如下：

`

from detect import run

run_dict = {

'weights': 'best.pt',

'source': 0,

'imgsz': [640, 640],

'conf_thres': 0.85,

'iou_thres': 0.75,

'max_det': 10,

'device': '0',

'view_img': False,

'save_txt': False,

'save_conf': False,

'save_crop': False,

'nosave': True,

'classes': None,

'agnostic_nms': False,

'augment': False,

'visualize': False,

'update': False,

'project': 'runs/detect',

'name': 'exp',

'exist_ok': False,

'line_thickness': 3,

'hide_labels': False,

'hide_conf': False,

'half': False,

'dnn': False

}

run(**run_dict)

`

从训练结果文件夹中找到best.pt复制到yolov5文件夹下。

图形界面还没写，主要是加载参数并且调用detect.py。基本没有太大技术含量。

运行此代码尝试一下，似乎效果还可以？

5.优化

虽然能够正确识别无遮挡的人脸和口罩遮挡的人脸，但是此模型在面对其他类型的遮挡攻击时表现较差。

目前的优化思路有两个：

1、二次识别

2、增加攻击数据

二次识别需要更多的数据，需要更多的代码。才疏学浅，只好选择增加攻击数据重新训练。

6.封装项目

由于之前使用的是虚拟环境，在使用Pyinstaller打包时遇到问题无数。

打包后的程序在自己电脑上运行正常，去其他电脑上运行频繁报错。

最后经高人指点乃是conda导致部分库打包不完全，需要在实际环境中打包或是指定路径，在此一并感谢。

时间紧迫，后续工作就不开展了。

附模型分享：

链接：https://pan.baidu.com/s/1tmT_9oE6tWw7s2Wa_KYpTA

提取码：z3k1

Python小组作业：基于yolov5的口罩佩戴识别的更多相关文章

机器学习经典算法详解及Python实现--基于SMO的SVM分类器
原文:http://blog.csdn.net/suipingsp/article/details/41645779 支持向量机基本上是最好的有监督学习算法,因其英文名为support vector ...
基于卷积神经网络的人脸识别项目_使用Tensorflow-gpu+dilib+sklearn
https://www.cnblogs.com/31415926535x/p/11001669.html 基于卷积神经网络的人脸识别项目_使用Tensorflow-gpu+dilib+sklearn ...
Pytorch实现基于卷积神经网络的面部表情识别(详细步骤)
文章目录一.项目背景二.数据处理 1.标签与特征分离 2.数据可视化 3.训练集和测试集三.模型搭建四.模型训练五.完整代码一.项目背景数据集cnn_train.csv包含人类面部表情的图 ...
基于SVM的字母验证码识别
基于SVM的字母验证码识别摘要本文研究的问题是包含数字和字母的字符验证码的识别.我们采用的是传统的字符分割识别方法,首先将图像中的字符分割出来,然后再对单字符进行识别.首先通过图像的初步去噪.滤波 ...
基于Tesseract组件的OCR识别
基于Tesseract组件的OCR识别背景以及介绍欲研究C#端如何进行图像的基本OCR识别,找到一款开源的OCR识别组件.该组件当前已经已经升级到了4.0版本.和传统的版本(3.x)比,4.0时代 ...
基于Deep Learning 的视频识别方法概览
深度学习在最近十来年特别火,几乎是带动AI浪潮的最大贡献者.互联网视频在最近几年也特别火,短视频.视频直播等各种新型UGC模式牢牢抓住了用户的消费心里,成为互联网吸金的又一利器.当这两个火碰在一起,会 ...
[python 译] 基于面向对象的分析和设计
[python 译] 基于面向对象的分析和设计 // */ // ]]> [python 译] 基于面向对象的分析和设计 Table of Contents 1 原文地址 2 引言 2.1 ...
python中基于descriptor的一些概念
python中基于descriptor的一些概念(上) 1. 前言 2. 新式类与经典类 2.1 内置的object对象 2.2 类的方法 2.2.1 静态方法 2.2.2 类方法 2.3 新式类(n ...
python实现基于CGI的Web应用
python实现基于CGI的Web应用本文用一个“网上书店”的web应用示例,简要介绍如何用Python实现基于CGI标准的Web应用,介绍python的cgi模块.cigtb模块对编写CGI脚本提 ...

随机推荐

C/C++ Qt TableWidget 表格组件应用
TableWidget 表格结构组件,该组件可以看作是TreeWidget树形组件的高级版,表格组件相比于树结构组件灵活性更高,不仅提供了输出展示二维表格功能,还可以直接对表格元素直接进行编辑与修改操 ...
城市防汛应急管理智慧 Web GIS 可视化平台
前言今年第 17 号台风"狮子山"(热带风暴级)登陆海南岛,受"狮子山"影响,海南岛北半部地区出现暴雨到大暴雨.局地特大暴雨.台风带来的强风雨导致海南岛多地树 ...
AtCoder Beginner Contest 200
前言:果然自己连\(ABC\)都打不好了吗. 没看清题目,卡了巨久,排名一直跌,笔记本键盘坏了,心态崩了. 冷静. ------------------------------------------ ...
R包xlsx安装与使用
1. Rstudio安装xlsx报错 xlsx包加载依赖Java环境,我之前就安装过Java,但安装xlsx成功后,加载xlsx时一直报错: Error : loadNamespace()里算'rJ ...
【Python小试】判断一条序列GC含量高低
题目: 随便给定一条序列,如果GC含量超过65%,则认为高. 编程: from __future__ import division #整数除法 def is_gc_rich(dna): length ...
tcp可靠传输的机制有哪些（面试必看
一.综述 1.确认和重传:接收方收到报文就会确认,发送方发送一段时间后没有收到确认就重传. 2.数据校验 3.数据合理分片和排序: UDP:IP数据报大于1500字节,大于MTU.这个时候发送方IP层 ...
nginx 的一个conf配置
server { listen 80 default_server; server_name www.caipudq.cn caipudq.cn *.caipudq.cn; root /mnt/www ...
简易kmeans-c++版本
typedef double dtype; 主要接口: void Kmeans(const vector<vector<dtype> > &d,int k,string ...
Redis | Redis常用命令及示例总结（API）
目录前言 1. Key(键) 1.1 键的基本操作功能 del move sort rename renamenx migrate 1.2 键的获取功能 type exists randomkey ...
.NET Core基础篇之：集成Swagger文档与自定义Swagger UI
Swagger大家都不陌生,Swagger (OpenAPI) 是一个与编程语言无关的接口规范,用于描述项目中的 REST API.它的出现主要是节约了开发人员编写接口文档的时间,可以根据项目中的注释 ...

Python小组作业：基于yolov5的口罩佩戴识别

Python小组作业：基于yolov5的口罩佩戴识别的更多相关文章

随机推荐

热门专题