DOTA数据集

航拍图像面临的问题

正常图像受重力作用相对固定，航拍图像的物体受拍摄角度影响
航拍图像的物体比例变化很大
某些航拍图像中小物体很密集
传统的数据集面临数据偏差的问题严重

好的数据集必备的几个特征

大量图像数据
单个类别有足够多的实例
正确定向对象说明
单张图片中有足够多种类的物体，以便接近于真实世界

DOTA数据集特征

15种类别：飞机、轮船、储槽、网球场、篮球场、棒球场、田径场、港口、桥、大的交通工具、小的交通工具、直升机、环岛、足球场、游泳池。其中14个主类，（交通工具算一个主类）

paper中的描述：plane, ship, storage tank, baseball diamond, tennis court, basketball court, ground track field, harbor, bridge, large vehicle, small vehicle, helicopter, roundabout, soccer ball field and basketball court.
传统的bbox检测方式通过四元组$ (x_c, y_c, w, h)$来表示，即一个没有角度的bounding box来识别object

两种思路：

$(x_c, y_c, w, h, \theta)$,只能用来标记正方形的bbox，不能将大物体紧密的包围在bbox中
四个点的不规则四边形。选定初始点为第一个点，然后按照顺时针方向依次标注四个点。初始点的选择规则：物体头部或者左上角点

数据集划分：1/6的验证集、1/3的测试集和1/2的训练集，其中测试集不会公布。
图片尺寸从800X800到4000X4000不等，传统的数据集少有超过1000X1000的。
图像中的实例很多，纵横比不一。传统用于COCO检测的模型不适用（类似密集检测）。图像中相同类别的物体的大小比例不一致（基于航拍的距离变化），对模型提出了更多的挑战。细粒度的模型表现会更好，因为模型会更加关注物体的特征而不是通过大小来判别物体。
数据集中基于航拍距离的图片比例如下：

评估原型

图片太大，训练时对其进行切分。但很可能将一个完整的物体切分成几部分。对于$U_i = \frac{a_i}{A_0} < 0.7$的物体（可以理解为如果在切分后的图片中，这个物体只有原来的70%以下的部分了），就认为识别它是一个比较难的任务
两种任务：HBB（Horizontal bounding box） and OBB(oriented bounding box)。OBB对模型造成了很大的困难。
各种模型在DOTA数据集上的表现，左为HBB，右为OBB

结果分析

交通工具类和轮船类的分析结果不好，主要原因在于这类物体太小、太密集。
对比HBB和OBB的结果，HBB的定位精确度要比OBB差很多，证明了OBB是更加适合实际应用的方式。
具有较大纵横比的物体对于OBB方式的模型来说更加难回归。
交叉数据集验证证明了模型在DOTA数据集上的表现普遍很差，DOTA数据集的挑战性更加强。

DOTA数据集的更多相关文章

论文翻译 DOTA:A Large-scale Dataset for Object Detection in Aerial Images
简介:武大遥感国重实验室-夏桂松和华科电信学院-白翔等合作做的一个航拍图像数据集摘要: 目标检测是计算机视觉领域一个重要且有挑战性的问题.虽然过去的十几年中目标检测在自然场景已经有了较重要的成就 ...
Arbitrary-Oriented Object Detection with Circular Smooth Label（ECCV2020，旋转目标检测）
论文链接:https://arxiv.org/abs/2003.05597 code:https://github.com/Thinklab-SJTU/CSL_RetinaNet_Tensorflow ...
Dynamic Anchor Learning for Arbitrary-Oriented Object Detection（DAL)
面向任意目标检测的动态锚点学习摘要:面向任意的目标广泛地出现在自然场景.航空照片.遥感图像等中,因此面向任意的目标检测得到了广泛的关注.目前许多旋转探测器使用大量不同方向的锚点来实现与地面真实框的空 ...
SCRDet——对小物体和旋转物体更具鲁棒性的模型
引言明确提出了三个航拍图像领域内面对的挑战: 小物体:航拍图像经常包含很多复杂场景下的小物体. 密集:如交通工具和轮船类,在航拍图像中会很密集.这个DOTA数据集的发明者也提到在交通工具和轮船类的检 ...
R2CNN模型——用于文本目标检测的模型
引言 R2CNN全称Rotational Region CNN,是一个针对斜框文本检测的CNN模型,原型是Faster R-CNN,paper中的模型主要针对文本检测,调整后也可用于航拍图像的检测中去 ...
PIoU Loss：倾斜目标检测专用损失函数，公开超难倾斜目标数据集Retail50K | ECCV 2020 Spotlight
论文提出从IoU指标延伸来的PIoU损失函数,能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果,对anchor-based方法和anchor-free方法均适用.另外论文提供了Retail5 ...
SSD框架训练自己的数据集
SSD demo中详细介绍了如何在VOC数据集上使用SSD进行物体检测的训练和验证.本文介绍如何使用SSD实现对自己数据集的训练和验证过程,内容包括: 1 数据集的标注2 数据集的转换3 使用SSD如 ...
HTML5 数据集属性dataset
有时候在HTML元素上绑定一些额外信息,特别是JS选取操作这些元素时特别有帮助.通常我们会使用getAttribute()和setAttribute()来读和写非标题属性的值.但为此付出的代价是文档将 ...
数据集偏斜 - class skew problem - 以SVM松弛变量为例
原文接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C.回头看一眼引入了松弛变量以后的优化问题: 注意其中C的位置,也可以回想一下C所起的 ...

随机推荐

单片机I/O口推挽与开漏输出详解（力荐）
推挽输出:可以输出高,低电平,连接数字器件;推挽结构一般是指两个三极管分别受两互补信号的控制,总是在一个三极管导通的时候另一个截止. 开漏输出:输出端相当于三极管的集电极. 要得到高电平状态需要上拉电 ...
请问为什么要用三极管驱动mos,直接用mos有什么缺点呢？
可能无法完全导通,电流可能过小使导通所需时间变长,最终导致发热严重回复举报 csaaa DIY七级 3# 发表于 2016-7-12 14:11:59 直接驱动mos也没什么问 ...
《基于SIR的路边违停行为传播模型研究》
My Focus: 路边违停行为的传播模型; 学习基于SIR XXX模型的可行性分析.建立和结论分析 Author: 左忠义,王英英,包蕴 Mind Map:
bash执行顺序：alias --> function --> builtin --> program
linux bash的执行顺序如下所示: 先 alias --> function --> builtin --> program 后验证过程: 1,在bash shell中有内置 ...
path-sum leetcode C++
Given a binary tree and a sum, determine if the tree has a root-to-leaf path such that adding up all ...
hdu 5056 Boring count （类似单调队列的做法。。）
给一个由小写字母构成的字符串S,问有多少个子串满足:在这个子串中每个字母的个数都不超过K. 数据范围: 1<=T<= 1001 <= the length of S <= 10 ...
CVAT 用户指南
用户指南计算机视觉标注工具(CVAT)是基于 Web 为计算机视觉算法标注视频和图像的在线工具. 它的灵感来自Vatic免费的.在线的.交互式的视频注释工具. CVAT有许多强大的功能: 在关键帧之 ...
3D 穿梭效果？使用 UWP 也能搞定
昨天 ChokCoco 大佬搞了个 3D 穿梭效果出来,具体可见这里: 3D 穿梭效果?使用 CSS 轻松搞定这个效果太神奇了,他还问我能不能用 WPF 搞出来,因为我完全没用过 WPF 的 3D, ...
关于Python中用户输入字符串（与变量名相同）无法作为变量名引用的理解以及解决方案
在用户登录账号时,我需要在字典中查找是否存在其账号名称以及密码是否正确. 所以,我想将用户输入的账号赋值给变量,在字典中查找是否有此指值. 代码如下: 1 Ya = {'姓名': 'Ya', 'pas ...
Django 小实例S1 简易学生选课管理系统 6 实现登录逻辑
Django 小实例S1 简易学生选课管理系统第6节--实现登录逻辑点击查看教程总目录作者自我介绍:b站小UP主,时常直播编程+红警三,python1对1辅导老师. 1 业务逻辑本教程第四节里 ...

DOTA数据集

航拍图像面临的问题

好的数据集必备的几个特征

DOTA数据集特征

评估原型

结果分析

DOTA数据集的更多相关文章

随机推荐

热门专题