YOLOV4所用到的一些tricks

原文链接：http://arxiv.org/abs/2004.10934

整体框架

Bag of Freebies(BoF) & Bag of Specials (BoS)

　　Bag of Freebies(BoF) 指那些能够提高精度而不增加推断时间的技术。比如数据增广的方法图像几何变换、CutOut、grid mask等，网络正则化的方法DropOut、DropBlock等，类别不平衡的处理方法、难例挖掘方法、损失函数的设计等。

　　Bag of Specials (BoS)是指那些增加稍许推断代价，但可以提高模型精度的方法，比如增大模型感受野的SPP、ASPP、RFB等，引入注意力机制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等，特征集成方法SFAM , ASFF , BiFPN等，改进的激活函数Swish、Mish等，或者是后处理方法如soft NMS、DIoU NMS等。

Backbone: CSPDarknet53

source： CSPNet: A new backbone that can enhance learning capability of cnn论文；

CSPNet提出主要是为了解决三个问题： a.增强CNN的学习能力，能够在轻量化的同时保持准确性。

　　　　　　　　　　　　　　　　　　b.降低计算瓶颈。

　　　　　　　　　　　　　　　　　　c.降低内存成本。

CSP 在 DenseNet的使用

Neck: SPP（Spatial pyramid pooling）、PANet（Path Aggregation Network）

source:

　　　　SPP：Spatial pyramid pooling in deep convolutional networks for visual recognition。

　　 PANet: Path Aggregation Network for Instance Segmentation .(实力分割中提出）

PANet 网络框架

　　关键：更好的利用特征融合 1.为了提高低层信息的利用率，加快低层信息的传播效率，提出了Bottom-up Path Augmentation； 2.通常FPN在多层进行选anchors时，根据anchors的大小，将其分配到对应的层上进行分层选取。这样做很高效，但同时也不能充分利用信息了，提出了Adaptive Feature Pooling。 3.为了提高mask的生成质量，将卷积-上采样和全连接层进行融合，提出了Fully-connected Fusion。

CutMix and Mosaic data augmentation, DropBlock regularization, Class label smoothing

source：

　　　　CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features (开源）

Mixup:将随机的两张样本按比例混合，分类的结果按比例分配（个人看法：如果是使用一个随机数来控制权重，可能AP会增）；

Cutout:随机的将样本中的部分区域cut掉，并且填充0像素值，分类的结果不变；

CutMix:就是将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值，分类结果按一定的比例分配

Mosaic data augmentation：可以见论文给的示例图，提出了一种混合四幅训练图像的数据增强方法。

DropBlock regularization(来自知乎）:

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　各种Dropout 组合

Mish activation, Cross-stage partial connections (CSP), Multi- input weighted residual connections (MiWRC)

source:

　　　　Mish: A Self Regularized Non-Monotonic Neural Activation Function论文（开源）

激活函数公式：Mish=x * tanh(ln(1+e^x))

　　描述：x轴无边界(即正值可以达到任何高度)避免了由于封顶而导致的饱和。理论上对负值的轻微允许允许更好的梯度流，而不是像ReLU中那样的硬零边界。最后，平滑的激活函数允许更好的信息深入神经网络，从而得到更好的准确性和泛化。

Mish 激活函数的曲线

CSP、MiWRC 都是一种让网络更好训练的跳接方式。

CIoU-loss, CmBN

发展历程： IoU loss -> Giou loss -> Diou loss & Cious loss

主要依据：geometric factors：overlap area, central point distance and aspect ratio

IOU loss ：依据交并比的loss, 不做介绍了。

Giou loss：

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　GIOU核心算法

Diou loss

切入点：

第一：直接最小化预测框与目标框之间的归一化距离是否可行，以达到更快的收敛速度。

第二：如何使回归在与目标框有重叠甚至包含时更准确、更快。

R(B, Bgt)为预测框与真实框的惩罚项。

b, bgt分别为框的中心，P^2即两个点的欧式距离，c^2为包含两个框的最小框的对角线长度。

Ciou loss

在Diou loss 的基础上考虑了—— the consistency of aspect ratio 即公式中的 ν参数，α 为权衡参数。

CmBN

CMBN示意图

Self-Adversarial Training (SAT)

　　SAT 为一种新型数据增强方式。在第一阶段，神经网络改变原始图像而不是网络权值。通过这种方式，神经网络对其自身进行一种对抗式的攻击，改变原始图像，制造图像上没有目标的假象。在第二阶段，训练神经网络对修改后的图像进行正常的目标检测。

注意力机制——SAM、PAN

所做改进： 将SAM从空间注意力机制修改为点上的注意力机制，并将PAN的相加模块改为级联。

读完结论

一系列堆料，结果建立在好的backbone 上面，好的backbone 再加入一系列训练提高方式，必然长点。

YOLOV4所用到的一些tricks的更多相关文章

YOLOv3和YOLOv4长篇核心综述（下）
YOLOv3和YOLOv4长篇核心综述(下) 4.3.3 Neck创新在目标检测领域,为了更好的提取融合特征,通常在Backbone和输出层,会插入一些层,这个部分称为Neck.相当于目标检测网络的 ...
YOLOv3和YOLOv4长篇核心综述（上）
YOLOv3和YOLOv4长篇核心综述(上) 对目标检测算法会经常使用和关注,比如Yolov3.Yolov4算法. 实际项目进行目标检测任务,比如人脸识别.多目标追踪.REID.客流统计等项目.因此目 ...
Yolov3&Yolov4网络结构与源码分析
Yolov3&Yolov4网络结构与源码分析从2018年Yolov3年提出的两年后,在原作者声名放弃更新Yolo算法后,俄罗斯的Alexey大神扛起了Yolov4的大旗. 文章目录 1. 论 ...
YOLO-v4 口罩识别
YOLO-v4 口罩识别一.YOLO-v4概念如果想要了解和认识yolo-v4的基本概念,首先要提的就是它的基础版本yolo-v1,对于yolo来说,最经典的算是yolo-v3.如果想要了解它的由 ...
YOLO-V4 实现口罩识别（附加数据、数据批量处理程序）
一.YOLO-v4概念如果想要了解和认识yolo-v4的基本概念,首先要提的就是它的基础版本yolo-v1,对于yolo来说,最经典的算是yolo-v3.如果想要了解它的由来和历史的话,可以自行搜索 ...
如何使用 Yolov4 训练人脸口罩检测模型
前言疫情当下,出入医院等公共场所都被要求佩戴口罩.这篇博客将会介绍如何使用 Yolov4,训练一个人脸口罩检测模型(使用 Yolov4 的原因是目前只复现到了 v4 ),代码地址为 https:// ...
testng 教程之使用参数的一些tricks配合使用reportng
前两次的总结:testng annotation生命周期 http://www.cnblogs.com/tobecrazy/p/4579414.html testng.xml的使用和基本配置http: ...
(转) How to Train a GAN? Tips and tricks to make GANs work
How to Train a GAN? Tips and tricks to make GANs work 转自:https://github.com/soumith/ganhacks While r ...
《所用到的AJAX技术基础》
来自百度网页,w3cshool网页:AJAX = Asychronous JavaScript and XML,翻译成中文为:异步的JavaScript XML. 异步的意思就是不重新加载整个页面,后 ...

随机推荐

stand up meeting 11/17/2015
今日工作总结: 冯晓云:代表组内参加了北航软工M1检查,有幸在工作展开之前先观摩别人的工作,吸取经验和教训:现在看来,当时对往届ASE学员的采访还不够深入,只说统筹分工团结合作还是有些空,具体的任务划 ...
如何将你的 Vue.js 项目部署在云开发静态托管之上
云开发静态托管是云开发提供的静态网站托管的能力,静态资源(HTML.CSS.JavaScript.字体等)的分发由腾讯云对象存储 COS 和拥有多个边缘网点的腾讯云 CDN 提供支持. 在云开发静态托 ...
详解 volatile关键字与 CAS算法
(请观看本人博文 -- <详解多线程>) 目录内存可见性问题 volatile关键字 CAS算法: 扩展 -- 乐观锁与悲观锁: 悲观锁: 乐观锁: 在讲解本篇博文的知识点之前,本 ...
v&n赛 ML 第一步（python解决）
题目链接给了70组x,y,根据提示,是求拟合曲线,再通过x求y 知道MATLAB应该录入就能解决吧,但是没下这软件,试试用python解决 #coding:utf- from pwn import ...
Laravel - 上手实现 - 邮件发送
Laravel 自带 SwiftMailer 库,集成了多种邮件API,可以很方便的实现邮件的发送. 我们使用到的是SMTP(Simple Message Transfer Protocol)简单邮件 ...
mysql参数max_binlog_cache_size设置不当引发的血案
日常运维中的坑真是防不胜防,不一小心就遇到别人给你挖的坑.最近又遇到经验不足的DBA不知道从哪拷贝的配置文件(据说是当时参加某培训机构视频培训是资料里的模板,真的是误人子弟呀),其中把max_binl ...
.Net Core主机配置
Host:(主机)负责web应用程序的启用和生成期管理,配置服务器和请求处理管道. 主机配置日志,依赖注入关系,实际上是一个封装了应用资源的对象. 创建主机生成器-〉配置主机-〉创建主机-〉运行主机. ...
Ansible playbook Vault 加密
Ansible playbook Vault 加密详解与使用案例主机规划添加用户账号说明: 1. 运维人员使用的登录账号: 2. 所有的业务都放在 /app/ 下「yun用户的家目录」,避免业务 ...
用scanf、printf输入输出string型字符串
c语言里是没有string型的,string在c++里面.有的时候在c++里要用scanf.printf输入输出string型字符串,这是可以实现的,不过要做一点处理. 具体操作看代码: #inclu ...
PHP中的11个魔术方法
1.__get.__set 这两个方法是为在类和他们的父类中没有声明的属性而设计的 __get( $property ) 当调用一个未定义的属性时访问此方法__set( $property ...

YOLOV4所用到的一些tricks

YOLOV4所用到的一些tricks的更多相关文章

随机推荐

热门专题