前言 本文收集汇总了目前CVPR 2022已放出的一些数据集资源。

转载自极市平台

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

M5Product Dataset

论文地址:https://arxiv.org/abs/2109.04275

数据集地址:https://xiaodongsuper.github.io/M5Product_dataset/index.html

M5Product 数据集是一个大规模的多模态预训练数据集,具有针对电子产品的粗粒度和细粒度注释。

  • 600 万个多模态样本、5k个属性和2400 万个值
  • 5 种模式-图像 文本 表 视频 音频
  • 600 万个类别注释,包含6k个类别
  • 广泛的数据源(100 万商户提供)

Ego4D

论文地址:https://arxiv.org/abs/2110.07058

数据集地址:https://ego4d-data.org/

在全球 74 个地点和 9 个国家/地区收集的大规模、以自我为中心的数据集和基准套件,包含超过 3,670 小时的日常生活活动视频。使用七种不同的现成头戴式摄像机捕获数据:GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了视频,部分 Ego4D 还提供其他数据模式:3D 扫描、音频、凝视、立体、多个同步的可穿戴相机和文本叙述。

Daily Multi-Spectral Satellite Dataset

论文链接:https://arxiv.org/pdf/2203.12560.pdf

数据集地址:https://mediatum.ub.tum.de/1650201

DynamicEarthNet 数据集包含每日 Planet Fusion 图像,以及两年内全球 75 个地区的每月土地覆盖类别。七个土地覆盖类别以时间一致的方式手动注释。还提供了 Sentinel 2 图像。该数据集是第一个大规模的多类和多时态变化检测基准,我们希望它能促进地球观测和计算机视觉领域的多时态研究新浪潮。

VCSL (Video Copy Segment Localization) dataset

论文地址:https://arxiv.org/abs/2203.02654

数据集地址:https://github.com/alipay/VCSL/tree/main/data

与现有的受视频级标注或小规模限制的复制检测数据集相比,VCSL 不仅具有两个数量级的片段级标记数据,16 万个真实视频副本对包含超过 28 万个本地复制片段对,而且涵盖各种视频类别和广泛的视频时长。每个收集的视频对中的所有复制片段都是手动提取的,并附有精确注释的开始和结束时间戳。

Rope3D

论文地址:https://arxiv.org/abs/2203.13608

数据集地址:https://thudair.baai.ac.cn/rope

Rope3D目标检测数据集是首个同时具有图像和点云3D联合标注的大规模、多视角的路侧数据集,共50009帧图像数据以及对应的2D&3D标注结果。基于该数据集,可以进行路端单目3D检测任务的研究。

EDS 数据集

数据集地址:https://github.com/DIG-Beihang/PSN

EDS 数据集针对由机器硬件参数引起的难以察觉的域间偏移问题研究,包含了来自 3 台不同 X 光机器的 14219 张图片, 其中 10 类物品, 共计 31655 个目标实例,均由专业标注人员进行标注。

FineDiving

论文地址:https://arxiv.org/pdf/2204.03646.pdf

数据集地址:https://github.com/xujinglin/FineDiving

本数据集收集了奥运会、世界杯、世锦赛以及欧锦赛的跳水项目比赛视频。每个比赛视频都提供了丰富的内容,包括所有运动员的跳水记录、不同视角的慢速回放等。

我们构建了一个由语义和时间结构组织的细粒度视频数据集,其中每个结构都包含两级注释。

对于语义结构,动作级标签描述了运动员的动作类型,步骤级标签描述了过程中连续步骤的子动作类型,其中每个动作过程中的相邻步骤属于不同的子动作类型。子动作类型的组合产生动作类型。在时间结构中,动作级标签定位运动员执行的完整动作实例的时间边界。在此注释过程中,我们丢弃所有不完整的动作实例并过滤掉慢速播放。步骤级标签是动作过程中连续步骤的起始帧。

PIAA 数据库

论文地址:https://arxiv.org/abs/2203.16754

数据集地址:https://cv-datasets.institutecv.com/#/data-sets

个性化图像美学评估 (PIAA) 由于其高度主观性而具有挑战性。人们的审美取决于多种因素,包括形象特征和主体性格。现有的 PIAA 数据库在注释多样性方面,特别是在学科方面受到限制,已不能满足日益增长的 PIAA 研究需求。为了解决这一难题,我们对个性化图像美学进行了迄今为止最全面的主观研究,并引入了一个新的具有丰富属性的个性化图像美学数据库(PARA),该数据库由 438 个主题的 31,220 张带有注释的图像组成。PARA 具有丰富的标注,包括 9 个面向图像的客观属性和 4 个面向人的主观属性。

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV技术指南创建了一个免费的知识星球。关注公众号添加编辑的微信号可邀请加入。

其它文章

Attention Mechanism in Computer Vision

从零搭建Pytorch模型教程(三)搭建Transformer网络

从零搭建Pytorch模型教程(二)搭建网络

从零搭建Pytorch模型教程(一)数据读取

YOLO系列梳理与复习(二)YOLOv4

YOLO系列梳理(一)YOLOv1-YOLOv3

StyleGAN大汇总 | 全面了解SOTA方法、架构新进展

一份热力图可视化代码使用教程

一份可视化特征图的代码

工业图像异常检测研究总结(2019-2020)

小样本学习研究综述(中科院计算所)

目标检测中正负样本区分策略和平衡策略总结

目标检测中的框位置优化总结

目标检测、实例分割、多目标跟踪的Anchor-free应用方法总结

Soft Sampling:探索更有效的采样策略

如何解决工业缺陷检测小样本问题

关于快速学习一项新技术或新领域的一些个人思维习惯与思想总结

CVPR 2022数据集汇总|包含目标检测、多模态等方向的更多相关文章

  1. 基于COCO数据集验证的目标检测算法天梯排行榜

    基于COCO数据集验证的目标检测算法天梯排行榜 AP50 Rank Model box AP AP50 Paper Code Result Year Tags 1 SwinV2-G (HTC++) 6 ...

  2. gluoncv 训练自己的数据集,进行目标检测

    跑了一晚上的模型,实在占GPU资源,这两天已经有很多小朋友说我了.我选择了其中一个参数. https://github.com/dmlc/gluon-cv/blob/master/scripts/de ...

  3. CVPR 2019 论文解读 | 小样本域适应的目标检测

    引文 ​ 最近笔者也在寻找目标检测的其他方向,一般可以继续挖掘的方向是从目标检测的数据入手,困难样本的目标检测,如检测物体被遮挡,极小人脸检测,亦或者数据样本不足的算法.这里笔者介绍一篇小样本(few ...

  4. tensorflow目标检测API之训练自己的数据集

    1.训练文件的配置 将生成的csv和record文件都放在新建的mydata文件夹下,并打开object_detection文件夹下的data文件夹,复制一个后缀为.pbtxt的文件到mtdata文件 ...

  5. VOC数据集 目标检测

    最近在做与目标检测模型相关的工作,很多都要求VOC格式的数据集. PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, P ...

  6. 目标检测coco数据集点滴介绍

    目标检测coco数据集点滴介绍 1.  COCO数据集介绍 MS COCO 是google 开源的大型数据集, 分为目标检测.分割.关键点检测三大任务, 数据集主要由图片和json 标签文件组成. c ...

  7. AI佳作解读系列(二)——目标检测AI算法集杂谈:R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3

    1 引言 深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...

  8. CVPR2019目标检测方法进展综述

    CVPR2019目标检测方法进展综述 置顶 2019年03月20日 14:14:04 SIGAI_csdn 阅读数 5869更多 分类专栏: 机器学习 人工智能 AI SIGAI   版权声明:本文为 ...

  9. 目标检测(一)RCNN--Rich feature hierarchies for accurate object detection and semantic segmentation(v5)

    作者:Ross Girshick,Jeff Donahue,Trevor Darrell,Jitendra Malik 该论文提出了一种简单且可扩展的检测算法,在VOC2012数据集上取得的mAP比当 ...

随机推荐

  1. 4、传统三层架构与DDD分层架构

    4.传统三层架构与DDD分层架构 模型是抽象的 现实是形象的 技巧是重要的 思想是永恒的 从传统三层架构与DDD分层架构的编程演变其实是思想的演变. 传统三层架构,即用户界面层UI.业务逻辑层BAL. ...

  2. JDBC-连接Druid数据池

    •导入Druid-jar包 •下载地址 链接:https://pan.baidu.com/s/1A3tSCT9BDXkzB7zbukzyPg?pwd=0000 提取码:0000 下载后具体导入操作和这 ...

  3. Ribbon和Feign的区别?

    1.Ribbon都是调用其他服务的,但方式不同.2.启动类注解不同,Ribbon是@RibbonClient feign的是@EnableFeignClients3.服务指定的位置不同,Ribbon是 ...

  4. SPI简单解析

    什么是SPI  一种服务加载方式,全名为Service Provider Interface,Service提供者接口 如果我们要抽象里面的模块,在面对对象编程当中,我们模块之间,一般推荐模块之间基于 ...

  5. 转载:23种常用设计模式的UML类图

    转载至:https://www.cnblogs.com/zytrue/p/8484806.html 23种常用设计模式的UML类图 本文UML类图参考<Head First 设计模式>(源 ...

  6. 杭电OJ 1248 不死族巫妖王 完全背包问题 字节跳动 研发岗编程原题

    转载至:https://blog.csdn.net/ssdut_209/article/details/51557776 Problem Description不死族的巫妖王发工资拉,死亡骑士拿到一张 ...

  7. Netty + Spring + ZooKeeper搭建轻量级RPC框架

    本文参考 本篇文章主要参考自OSCHINA上的一篇"轻量级分布式 RPC 框架",因为原文对代码的注释和讲解较少,所以我打算对这篇文章的部分关键代码做出一些详细的解释 在本篇文章中 ...

  8. 微信APP支付V3版本签名 && APP下单/订单查询接口Python版实现

    问题背景 最近接入微信支付,微信官方并没有提供Python版的服务端SDK,因而只能根据文档手动实现一版,这里记录一下微信支付的整体流程.踩坑过程与最终具体实现. 微信支付APP下单流程 根据微信官方 ...

  9. MySQL怎么用命令修改字段长度

    MySQL怎么用命令修改double字段长度 1 alter table 表名 modify column 列名 类型(要修改的长度) COMMENT 备注信息; 2 alter table t_ov ...

  10. 雅虎WEB前端网站优化—34条军规

    Yslow工具 1.Minimize HTTP Requests 减少HTTP请求 图片.css.script.flash等等这些都会增加http请求数,减少这些元素的数量就能减少响应时间.把多个JS ...