yolov2算法浅见

因为最近在复习yolo系列的算法，就借着这个机会总结一下自己对这个算法的理解，由于是第一次写算法类的博客，文中有什么错误和行文不通的地方还希望大家指正。

yolov2与yolov1有很多改变。

最重要的改动：引入了anchor机制。v1通过最后接一个全连接层直接输出bbox的坐标。在yolov2中参考了fast-rcnn中的先验框机制，通过卷积层来学习anchor的offsets避免了全连接层。为了试应anchor这一操作，作者在网络中移除了一个池化层，来获得更高的网络输出，并且为了得到奇数个grid cell，将网络的的输入分辨率从448转为416.yolo网络降采样32倍，所以最后输出是13x13. 在引入了anchor机制后，每一个anchor都生成类别与空间的预测，而不是yolov1中每一个grid cell生成一个Bx5+C的预测，这一点的引入加强了yolo对密集小目标的检测。在加入anchor后一张图从原来生成98个boxes改为生成上千个anchor boxes。这样做网络的Accuracy有所下降，但是recall召回率得到了显著的提升，因为目前在自动驾驶行业工作，联想到特斯拉之前在高速高速公路上把正样本识别成负样本所以在我看来自动驾驶中的目标检测召回率是要比准确率更重要的一个指标。

使用k-means聚类得出anchor。在距离时如果修正函数选择的还是欧氏距离的话，就会产生那个很经典的问题，大的目标框会比小目标框产生更大的error。所以为了使聚类时的distance不受框的大小影响，作者使用的一种新的距离计算方式：

这一操作有效的提高了最后结果的avg IOU，在自动驾驶的视觉方面，最后检测框的位置精度很大程度上会影响测距的精度。

对于 location predict输出内容的修改：对比RPN结构，RPN输出的是对anchor box的偏移量，这导致在模型训练初期会有很多bbox出现在图像的任意位置，这导致了训练初期模型的不稳定性，就是的训练需要更长的时间达到收敛。yolov2使用了对grid cell的偏移量来作为最后结果的输出，这使得与ground truth的差别落在了0和1直接，并在后面使用了sigmoid作为激活函数来限制输出。

最后网络输出5个值 tx ty tw th 和to，其中tx ty是之前介绍过的对于grid cell的偏移量，tw和th是对预测框的宽高和anchor的修正值。to是和yolov1一样是判定是否在grid cell中有物体并计算iou。最后输出预测框结果如下：

其中Cx和Cy是产生这个bbox的grid cell对于图像左上角的偏移量。pw和ph是anchor的宽和高。

使用了更细颗粒化的特征图：yolov2没有像ssd那样使用多尺度的特征图来产生anchor去使用不同大小的物体。而实使用了passthrough层来结合之前的26x26的特征图来讲最后的head部分特征图更finer-grained。

动态调整输入图片大小：由于yolov2的主干网络只使用了卷积层和池化层，这使得网络可以动态的调整特征图大小。为了使算法在不同分辨率上的图片表现的更好，在训练阶段，作者采用的了每10个batch就改变一下输入图像的尺度，因为网络的降采样是32倍，所以输入也都是32的倍数，从308到608.

backbone方面的改变：

YOLOV2中作者提出了自己的网络Darknet-19，而不是像v1中在googLEnet上做修改。正如绝大多数目标检测算法的backbone一样，darknet是一个分类网络，它把最后的全连接层换成了global average pooling层再接softmax层。整个网络只有卷积层和池化层，所以可以对输入灵活修改。下图为darknet的网络结构：

yolov2在每一个卷积层后都加入了BN层，在加入bn层后移除了训练中dropout的操作

yolov2在分类数据集ImageNet上预训练模型时直接使用了448x448分辨率的网络输入。在yolov1中预训练模型时输入的分辨率是224x224，在检测时才把分辨率转换成448x448

整个网络使用了19个卷积层和5个池化层。目前深度学习的网络设计思路就是加深加多参数，然后再去解决过拟合问题。

yolov2算法浅见的更多相关文章

yolo2详解
转自:https://blog.csdn.net/u014380165/article/details/77961414 YOLOV2要是YOLO的升级版(Better faster) Better ...
AI佳作解读系列(二)——目标检测AI算法集杂谈：R-CNN，faster R-CNN，yolo，SSD，yoloV2，yoloV3
1 引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...
检测算法简介及其原理——fast R-CNN，faster R-CNN，YOLO，SSD，YOLOv2，YOLOv3
1 引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...
Adaboost 算法的原理与推导
0 引言一直想写Adaboost来着,但迟迟未能动笔.其算法思想虽然简单“听取多人意见,最后综合决策”,但一般书上对其算法的流程描述实在是过于晦涩.昨日11月1日下午,邹博在我组织的机器学习班第8次 ...
目标检测网络之 YOLOv2
YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体. 每个格子预测B个bounding b ...
【深度学习】目标检测算法总结（R-CNN、Fast R-CNN、Faster R-CNN、FPN、YOLO、SSD、RetinaNet）
目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息.本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括F ...
yolo类检测算法解析——yolo v3
每当听到有人问“如何入门计算机视觉”这个问题时,其实我内心是拒绝的,为什么呢?因为我们说的计算机视觉的发展史可谓很长了,它的分支很多,而且理论那是错综复杂交相辉映,就好像数学一样,如何学习数学?这问题 ...
目标检测算法之YOLOv1与v2
YOLO:You Only Look Once(只需看一眼) 基于深度学习方法的一个特点就是实现端到端的检测,相对于其他目标检测与识别方法(如Fast R-CNN)将目标识别任务分成目标区域预测和类别 ...
ubuntu yolov2 训练自己的数据集
项目需求+锻炼自己,尝试用yolov2跑自己的数据集,中间遇到了很多问题,记下来防止忘记一.数据集首先发现由于物体特殊没有合适的现成的数据集使用,所以只好自己标注,为了减少工作量,先用opencv ...

随机推荐

HashMap扩容后是否需要rehash？
需要,因为要重新计算旧数组元素在新数组地址.HashMap在JDK1.8中的rehash算法(也就是扩容后重新为里面的键值对寻址的算法)进行优化.hash寻址算法是 index =(n - 1) &a ...
搭载华为麒麟9000的Mate X2：秒售罄，一机难求
本文首发 | 公众号:lunvey 昨日10点,搭载了麒麟9000芯片的华为Mate X2正式开售,定价17999,对于手机来说,价格实在是高昂. 虽然价格高昂,但是一分钱一分货,对于想抢先体验的网友 ...
xscan的安装和使用（作业整理）
1.将学习通上下载的xscan.rar进行解压. 2.将缺少的.dll文件粘贴到软件解压目录中. 3.点击打开软件. 3.1在运行中除了发现缺少.dll文件的问题,我电脑又出现类似问题, 采取了关闭防 ...
破解MySQL库user表hash密码
目录得到用户名和密码 hash 带*和不带*的区别破解hash 在线工具 Hashcat 实验环境 select version(); 得到用户名和密码 hash mysql安装好就会默认生成图中 ...
NodeJs 入门到放弃 — 常用模块及网络爬虫(二)
码文不易啊,转载请带上本文链接呀,感谢感谢 https://www.cnblogs.com/echoyya/p/14473101.html 目录码文不易啊,转载请带上本文链接呀,感谢感谢 https ...
阅读源码，HashMap回顾
目录回顾 HashMap简介类签名常量变量构造方法 tableSizeFor方法添加元素 putVal方法获取元素 getNode方法总结本文一是总结前面两种集合,补充一些遗漏,再者 ...
Java基础：常用基础dos命令
打开cmd的方式1.开始+系统+命令提示符2.win键+R 输入cmd 打开控制台3.在任意的文件夹下,按住shift键+鼠标右键点击,在此处打开命令提示行4.在资源管理器的地址栏前面加上cmd路径 ...
Ubuntu更换python默认版本
设置python版本: 1 sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100 2 sudo ...
[笔记] 扩展Lucas定理
[笔记] 扩展\(Lucas\)定理 \(Lucas\)定理:\(\binom{n}{m} \equiv \binom{n/P}{m/P} \binom{n \% P}{m \% P}\pmod{P} ...
Nodejs学习笔记（1） Nodejs安装+借助express模块简单部署服务器
1 安装 1.1 下载和安装 1.2 什么是REPL?如何使用? 1.3 npm对单一模块的安装和删除功能 1.4 通过package.json自定义模块(安装模块) 1.5 设置全局目录 2 部署网 ...

yolov2算法浅见

yolov2算法浅见的更多相关文章

随机推荐

热门专题