yolov3和ssd的区别

本文链接：https://blog.csdn.net/BlowfishKing/article/details/80485006

初步总结的SSD和yolo-v3之间的一些区别。

其中的一些概念还有待充分解释。

	SSD	YOLOv3
Loss	Softmax loss	Logistic loss
Feature extractor	VGG19	Darknet-53
Bounding Box Prediction	direct offset with default box	offset with gird cell by sigmoid activation
Anchor box	Different scale and aspect ratio	K-means from coco and VOC
Small objects	Semantic value for bottom layer is not high. Worse for small objects.	Higher resolution layers have higher semantic values. Better for small objects.
Big objects	Better. Feature map rangers from 38 * 38 to 3 * 3 ,1 * 1.	Worse. 13 * 13 feature map is the most coarse-grained.
Data Augmentation	different sample IOU crop on original image	randomly put the scaled original image (from 0.25 to 2) on the gray canvas
Input	resize original image to fixed size	Random multi-scale input
FPN	no	with FPN

SSD的loss中，不同类别的分类器是softmax，最终检测目标的类别只能是一类。而在yolo-v3中，例如对于80类的coco数据集，对于类别进行判断是80个logistic分类器，只要输出大于设置的阈值，则都是物体的类别，物体同时可以属于多类，例如一个物体同时是person和woman。

Backbone network。ssd原版的基础网络就是VGG19，也可以用mobile-net、resnet等。yolo-v3的基础网络是作者自己设计的darknet-53（因为具有53个卷积层），借鉴了resnet的shortcut层，根据作者的话，以更少的参数、更少的计算量实现了接近的效果。

Anchor box。ssd从faster-rcnn中吸收了这一思想，采用的是均匀地将不同尺寸的default box分配到不同尺度的feature map上。例如6个feature map的尺度，default box的大小从20%到90%的占比，同时有aspect_ratios = [[2], [2, 3], [2, 3], [2, 3], [2], [2]] ，最终可以计算出不同default box大小。而yolo-v3延续了yolo-v2的方法：从coco数据集中对bouding box 的（width, height）进行聚类，作者聚出9类，每类中心点取出作为一个box_size, 将每三个box_size划分给一个feature map。例如总共有(10,13), (16,30), (33,23), (30,61), (62,45), (59,119), (116,90), (156,198), (373,326)共9组w,h, 作者将后三个(116,90), (156,198), (373,326)作为13 * 13 的gird cell上的anchor box size。

图片输入。yolo-v3将输入图片映射到第一层feature map的固定比例是32。对于输入为416 * 416的图片，第一层feature map 大小为13 * 13。但是yolo-v3支持从300到600的所有32的倍数的输入。例如输入图片为320 * 320，这样第一层feature map就为10 * 10，在这样的gird cell中同样可以进行predict和match groudtruth。

Bounding Box 的预测方法。在不同的gird cell上，SSD预测出每个box相对于default box的位置偏移和宽高值。yolo-v3的作者觉得这样刚开始训练的时候，预测会很不稳定。因为位置偏移值在float的范围内都有可能，出现一个很大的值的话，位置都超出图片范围了，都是完全无效的预测了。所以yolov3的作者对于这位置偏移值都再做一个sigmoid激活，将范围缩为0-1 。b_x和b_y的值在(cell_x_loc, cell_x_loc+1), (cell_y_loc, cell_y_loc+1)之间波动。

yolov3为什么比ssd好.
不仅仅因为YOLO V3引入FPN结构，同时它的检测层由三级feature layers融合，而SSD的六个特征金字塔层全部来自于FCN的最后一层，其实也就是一级特征再做细化，明显一级feature map的特征容量肯定要弱于三级，尤其是浅层包含的大量小物体特征。

https://www.zhihu.com/question/269909535/answer/471978963

yolov3和ssd的区别的更多相关文章

emmc和ssd的区别【转】
本文转载自:https://blog.csdn.net/hawk_lexiang/article/details/78228789 emmc和ssd eMMC和SSD主要是满足不同需求而发展出来的NA ...
one-stage object detectors(1)
2019/04/08 强烈推荐:深入理解one-stage目标检测算法 yolo系列 one-stage object detectors(YOLO and SSD) 在不专一的模型中,每个检测器应该 ...
深度学习笔记（十三）YOLO V3 (Tensorflow)
[代码剖析] 推荐阅读! SSD 学习笔记之前看了一遍 YOLO V3 的论文,写的挺有意思的,尴尬的是,我这鱼的记忆,看完就忘了于是只能借助于代码,再看一遍细节了. 源码目录总览 tens ...
The Accidental DBA
The Accidental DBA (Day 1 of 30): Hardware Selection: CPU and Memory Considerations 本文大意: 全篇主要讲 ...
（转）Awesome Object Detection
Awesome Object Detection 2018-08-10 09:30:40 This blog is copied from: https://github.com/amusi/awes ...
TextBoxes 与 TextBoxes ++
TextBoxes 论文关键idea 本文和SegLink一样,也是在SSD的基础上进行改进的．相比SSD做了以下的改进: 修改了default box的apect ratio,分别为[1 2 3 5 ...
mysql特性及部署规范
--分支版本,mysql对cpu,内存,io子系统资源利用特点--oracle mysql,mariadb,percona server--部署规范建议,系统安装,mysql安装,其他规范互联网业务为 ...
paper-list
1.yolo-v1,yolo-v2,yolo-v3 2.ssd,focal loss,dssd 3.fast-rcnn,faster-rcnn,r-fcn,Light-Head R-CNN,R-FCN ...
目标检测论文解读10——DSSD
背景 SSD算法在检测小目标时精度并不高,本文是在在SSD的基础上做出一些改进,引入卷积层,能综合上下文信息,提高模型性能. 理解 Q1:DSSD和SSD的区别有哪些? (1)SSD是一层一层下采样, ...

随机推荐

bootstrap-select使用过程中的一些问题
这里总结一下上次使用bootstrap-select的过程中遇到的一些问题.至于bootstrap-select的具体使用方法这里就不介绍了,网上有很多例子. 地址: 官方插件地址:https://d ...
【OCR技术系列之四】基于深度学习的文字识别
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
搞定vscode编写java(手把手篇)
1: 下载VSCODE 本来我写过一个 vscode 编写java 帖子,但是还是很多人私信我,下面写一个手把手教程原文地址: https://www.cnblogs.com/dgwblog/p/ ...
基于appium的fixture应用之代码重构
一.痛点分析在appium自动化中,会话启动参数较多,我们使用了yaml配置文件来进行管理,并使用了PyYaml模块进行yaml文件内容的读取,我们知道,在测试场景中,不可能只会用到一种启动类型的参 ...
关于Oracle数据库的rownum应用
它是Oracle系统顺序分配为从查询返回的行的编号,返回的第一行分配的是1,第二行是2,以此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀. 如以下语句将无法 ...
HTML中跨域请求天气粗略效果
HTML中跨域请求天气粗略效果 html+css部分: <style> table{ border:1px red solid; border-collapse: collapse; ma ...
GitLab CI/CD持续集成设置
GitLab CI/CD持续设置官方文档地址(https://docs.gitlab.com/ee/ci/README.html) GitLab CI.CD功能非常完善,只需要简单几步,就可以完成项 ...
@Import与@ImportResource注解的解读
前言在使用Spring-Cloud微服务框架的时候,对于@Import和@ImportResource这两个注解想必大家并不陌生.我们会经常用@Import来导入配置类或者导入一个带有@Compon ...
Linux系统：centos7下搭建ZooKeeper3.4中间件，常用命令总结
本文源码:GitHub·点这里 || GitEE·点这里一.下载解压 1.Zookeeper简介 Zookeeper 作为一个分布式的服务框架,主要用来解决分布式集群中应用系统的一致性问题,它能提供 ...
启动jar包并生成日志的linux脚本
启动脚本 nohup java -Xms300m -Xmx300m -jar $1 >log/$2 2>&1 & 使用方式建立一个.sh结尾的脚本,里面放入此代码. 需要 ...

yolov3和ssd的区别

yolov3和ssd的区别的更多相关文章

随机推荐

热门专题