基于YOLO和PSPNet的目标检测与语义分割系统(python)
基于YOLO和PSPNet的目标检测与语义分割系统
概述
这是我的本科毕业设计
它的主要功能是通过YOLOv5进行目标检测,并使用PSPNet进行语义分割。
本项目YOLOv5部分代码基于 ultralytics YOLO V5 tag v5.0 。
相应地,我也使用了ultralytics/YOLOv5的预训练模型。
我通常使用两个最简单的预训练模型--yolov5s.pt和yolov5s.pt。你可以在./weights中直接看到它们。
在语义分割部分,我使用了PSPNet(全称为 Pyramid Scene Parsing Network
,即金字塔场景解析网络,此网络模型于2017年在CVPR上提出。
在我看来,这是性能和简洁性之间平衡得最好的网络之一。
事实上,在我拿到YOLOv5源代码后,我只花了一点时间就完成主要部分,而我花了大部分剩余时间将此模块与YOLO结合使用。
演示
典型的一组处理结果
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-atTo2il0-1651741499083)(demo_image/38.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U61zCEGy-1651741499086)(demo_image/39.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n9SRgvFZ-1651741499087)(demo_image/40.png)]
文件和文件夹
./weights
该文件夹包含四个训练前文件。yolov5s.pt和yolov5m.pt是目标检测模型、pspv5s.pt和pspv5m.pt是语义分割模型。它们都有很好的性能,但由于我的显卡性能不足,分割模型仍然有一些缺点。
需要指出的是,“xx5m.pt”的性能要好于“xx5s.pt”,因为它的网络更加复杂。
./runs
此文件夹包含检测、测试或训练项目的结果。
./demo_image
此文件夹包含一些演示图像。
./data
此文件夹包含所有数据集。 我主要通过CityScapes数据集训练我的分割模型,并在目标检测部分采用了预训练模型。
当然,如果您想继续训练YOLOv5模型,您将使用Microsoft Coco数据集。
./models
这个文件夹对我来说是最重要的。
在Common.py中,我主要添加了三个模块,RFB2和FFM起辅助作用,金字塔池模块起到分割作用,这部分代码都是仿照 PSPNet 论文模型编写的。
当然,有很多模块来自于ultralytics/YOLOv5,我删除了所有未使用的模块。
在yolo.py中,我添加了一个名为SegMaskPSP的类,它集成了Common.py中提到的三个模块,当训练模型时,parse_model函数将调用它。
train.py
该python文件与ultralytics/YOLOv5中的train.py文件大致相同。当我研究YOLO算法的时候,我对其做了一些更改。
它看起来有很大变化,但主体结构没有改变。
您可以使用cmd代码
python Train.py--data ciyscapes_de.yaml--cfg yolov5s_City_Seg.yaml--批量大小18--纪元200--权重。/yolov5s.pt--工人8--标签平滑0.1--img-大小832--非自动锚定
。
训练你自己的模型
当然,如果显卡的性能不是很高,您可以尝试降低workers运算单元的数量和batch-size的大小。
当然,我建议你直接使用我的预训练模型,或者如果你不缺钱的话,可以去找一些云GPU平台(事实上,我已经去过一个叫AutoDL的网站很多次了)。
test.py
通过一些著名的指标,如准确率、召回率、F1等来测试您的模型的性能。
您可以使用cmd代码。
python test.py--data data/Cityscapes_Det.yaml--Segdata./data/citys--Weights/pspv5m.pt--img-size1024--base-size1024。
来测试你的模型。
detect.py
如果你只想直接使用我的项目,这个文件对你来说可能是最重要的。
在文件中,您可以选择三种模式:①图像检测、②视频检测 和 ③摄像头实时检测。
predict.py
该python文件将调用detect.py进行检测
其他文件夹或文件来自ultralytics/YOLOv5,基本上无关紧要。。
requirements.txt
您可以使用pip install -r requirements s.txt安装所有需要的包。
如果你使用的是Windows系统,你应该把txt文件中的‘pycotools’替换为‘pycoTools-windows’。
当然,我猜您在安装它们时会遇到一些错误。我建议您使用Conda来创建一个新的Python虚拟环境。安装Anaconda后,您可以启动“Anaconda PowerShell Prompt”。
创建虚拟环境的代码是conda create-n you_env_name python=x.x .
您也可以使用conda install-n you_env_name package_name来安装其他包。
基于YOLO和PSPNet的目标检测与语义分割系统(python)的更多相关文章
- YOLT:将YOLO用于卫星图像目标检测
之前作者用滑动窗口和HOG来进行船体监测,在开放水域和港湾取得了不错的成绩,但是对于不一致的复杂背景,这个方法的性能会下降.为了解决这个缺点,作者使用YOLO作为物体检测的流水线,这个方法相比于HOG ...
- 基于COCO数据集验证的目标检测算法天梯排行榜
基于COCO数据集验证的目标检测算法天梯排行榜 AP50 Rank Model box AP AP50 Paper Code Result Year Tags 1 SwinV2-G (HTC++) 6 ...
- 基于模糊Choquet积分的目标检测算法
本文根据论文:Fuzzy Integral for Moving Object Detection-FUZZ-IEEE_2008的内容及自己的理解而成,如果想了解更多细节,请参考原文.在背景建模中,我 ...
- PyTorch专栏(八):微调基于torchvision 0.3的目标检测模型
专栏目录: 第一章:PyTorch之简介与下载 PyTorch简介 PyTorch环境搭建 第二章:PyTorch之60分钟入门 PyTorch入门 PyTorch自动微分 PyTorch神经网络 P ...
- CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)
CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)1. 目标检测:FCOS(CVPR 2019)目标检测算法FCOS(FCOS: ...
- 多加速器驱动AGX的目标检测与车道分割
多加速器驱动AGX的目标检测与车道分割 Object Detection and Lane Segmentation Using Multiple Accelerators with DRIVE AG ...
- 使用Keras基于RCNN类模型的卫星/遥感地图图像语义分割
遥感数据集 1. UC Merced Land-Use Data Set 图像像素大小为256*256,总包含21类场景图像,每一类有100张,共2100张. http://weegee.vision ...
- 10分钟学会使用YOLO及Opencv实现目标检测(下)|附源码
将YOLO应用于视频流对象检测 首先打开 yolo_video.py文件并插入以下代码: # import the necessary packages import numpy as np impo ...
- 基于Intel OpenVINO的搭建及应用,包含分类,目标检测,及分割,超分辨
PART I: 搭建环境OPENVINO+Tensorflow1.12.0 I: l_openvino_toolkit_p_2019.1.094 第一步常规安装参考链接:https://docs.op ...
随机推荐
- How to code like a pro in 2022 and avoid If-Else
在浏览文章的时候发现了一篇叙述有关if-else语句的文章,这篇文章作者是Thai Tran,他原文是用英语写的,然后看着文章浅显易懂,便尝试翻译成汉语.如有不妥还望指出. 原文链接:https:// ...
- DBPack 限流熔断功能发布说明
上周我们发布了 v0.4.0 版本,增加了限流熔断功能,现对这两个功能做如下说明. 限流 DBPack 限流熔断功能通过 filter 实现.要设置限流规则,首先要定义 RateLimitFilter ...
- TypeScript 项目报错 Unknown file extension ".ts"
下图是该问题的详细报错截图,经过多次捣鼓,初步猜测是模块有问题,要用 ES Module 还真是曲折,最不容易出错的就是 CommonJS 模块: 在百度.Bing 上搜索了好久的帖子也都没有相关的解 ...
- True 和 False 分别代表数字中的几?形象地记忆
True 和 False 作为布尔值分别代表的意思是真和假. 灯泡亮起就是 1,灯泡熄灭就是 0.0 就是无状态,所以可以代表灯泡熄灭的状态,而 1 就是有状态的,所以可以代表灯泡亮起的状态. 那么, ...
- spring boot 分布式session实现
spring boot 分布式session实现 主要是通过包装HttpServletRequest将session相关的方法进行代理. 具体是的实现就是通过SessionRepositoryFilt ...
- C# for循环创建多线程
这里仅讨论Task多线程编程,不讨论其他可以使用多线程的情况,比如Beginxxx,Thread等 一般情况下,如果有多个线程需要同是启动,且每个线程中使用了集合collection中的序号. 比如参 ...
- [WPF] 使用 HandyControl 的 CirclePanel 画出表盘刻度
1. 前言 最近需要一个 WPF 的表盘控件,之前 Cyril-hcj 写过一篇不错的博客 <WPF在圆上画出刻度线>,里面介绍了一些原理及详细实现的代码: double radius = ...
- 4.第三篇 PKI基础概念、cfssl工具介绍及kubernetes中证书
文章转载自:https://mp.weixin.qq.com/s?__biz=MzI1MDgwNzQ1MQ==&mid=2247483787&idx=1&sn=08dd3404 ...
- 使用python读取京东pdf发票信息导出到excel表格中
代码 #!/usr/bin/env python # -*- coding: utf-8 -*- """ pip install pdfminer3k pip insta ...
- 关于Loki中promtail组件收集日志的几点思考
promtail组件是采用docker方式运行的,配置文件也是在docker容器中,宿主机中没有挂载点,这就有问题了. 宿主机中没有挂载配置文件,也就没法修改,登录promtail的docker容器中 ...