什么是COCO数据集？

MS COCO的全称是Microsoft Common Objects in Context，起源于微软于2014年出资标注的Microsoft COCO数据集，与ImageNet竞赛一样，被视为是计算机视觉领域最受关注和最权威的比赛之一。

COCO数据集是一个可用于图像检测（image detection），语义分割（semantic segmentation）和图像标题生成（image captioning）的大规模数据集。它有超过330K张图像（其中220K张是有标注的图像），包含150万个目标，80个目标类别（object categories：行人、汽车、大象等），91种材料类别（stuff categoris：草、墙、天空等），每张图像包含五句图像的语句描述，且有250,000个带关键点标注的行人。

官网：https://cocodataset.org/

COCO种类

person

bicycle

car

motorbike

aeroplane

bus

train

truck

boat

traffic light

fire hydrant

stop sign

parking meter

bench

bird

cat

dog

horse

sheep

cow

elephant

bear

zebra

giraffe

backpack

umbrella

handbag

tie

suitcase

frisbee

skis

snowboard

sports ball

kite

baseball bat

baseball glove

skateboard

surfboard

tennis racket

bottle

wine glass

cup

fork

knife

spoon

bowl

banana

apple

sandwich

orange

broccoli

carrot

hot dog

pizza

donut

cake

chair

sofa

pottedplant

bed

diningtable

toilet

tvmonitor

laptop

mouse

remote

keyboard

cell phone

microwave

oven

toaster

sink

refrigerator

book

clock

vase

scissors

teddy bear

hair drier

toothbrush

COCO 格式

COCO 数据集由五个信息部分组成，提供了整个数据集的信息。COCO 物体检测数据集的格式记录在 COCO 数据格式中。

info：有关数据集的一般信息。
licenses：数据集中图像的许可信息。
images：数据集中图像的列表。
annotations：数据集中所有图像中存在的注释（包括边界框）的列表。
categories：标签类别列表。

要创建自定义标签清单，需要使用 COCO 清单文件中的 images、annotations 和 categories 列表。其他两个部分（info、licences）不是必需的。下面是一个 COCO 清单文件示例。

{

    "info": {

        "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01"

    },

    "licenses": [

        {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"}

    ],

    "images": [

        {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"},

        {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"}

    ],

    "annotations": [

        {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]},

        {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]},

        {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]}

    ],

    "categories": [

        {"supercategory": "speaker","id": 0,"name": "echo"},

        {"supercategory": "speaker","id": 1,"name": "echo dot"}

    ]

}

图像列表

COCO 数据集引用的图像列在图像数组中。每个图像对象都包含了有关该图像的信息，例如图像文件名。在以下示例图像对象中，请注意以下信息以及创建 Amazon Rekognition Custom Labels 清单文件需要哪些字段。

id：（必需）图像的唯一标识符。id 字段映射到注释数组（存储边界框信息的地方）中的 id 字段。
license：（非必需）映射到许可证数组。
coco_url：（可选）图像的位置。
flickr_url：（非必需）图像在 Flickr 上的位置。
width：（必需）图像的宽度。
height：（必需）图像的高度。
file_name：（必需）图像文件名。在本示例中，file_name 与 id 匹配，但 COCO 数据集对此不作要求。
date_captured：（必需）图像拍摄的日期和时间。

{

    "id": 245915,

    "license": 4,

    "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg",

    "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg",

    "width": 640,

    "height": 480,

    "file_name": "000000245915.jpg",

    "date_captured": "2013-11-18 02:53:27"

}

注释（边界框）列表

所有图像上的所有物体的边界框信息都存储在注释列表中。单个注释对象包含单个物体的边界框信息以及该物体在图像上的标签。图像上物体的每个实例都有一个注释对象。

在以下示例中，请注意以下信息以及创建 Amazon Rekognition Custom Labels 清单文件需要哪些字段。

id：（非必需）注释的标识符。
image_id：（必需）对应于图像数组中的图像 id。
category_id：（必需）用于标识边界框内物体的标签的标识符。它映射到类别数组的 id 字段。
iscrowd：（非必需）指定图像中是否包含物体群。
segmentation：（非必需）图像中物体的分段信息。Amazon Rekognition Custom Labels 不支持分段。
area：（非必需）注释的区域。
bbox：（必需）包含图像中物体的边界框的坐标（以像素为单位）。

{

    "id": 245915,

    "license": 4,

    "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg",

    "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg",

    "width": 640,

    "height": 480,

    "file_name": "000000245915.jpg",

    "date_captured": "2013-11-18 02:53:27"

}

类别列表

标签信息存储在类别数组中。在以下示例类别对象中，请注意以下信息以及创建 Amazon Rekognition Custom Labels 清单文件需要哪些字段。

supercategory：（非必需）标签的父类别。
id：（必需）标签标识符。id 字段映射到 annotation 对象中的 category_id 字段。在以下示例中，echo dot 的标识符为 2。
name：（必需）标签名称。

{"supercategory": "speaker","id": 2,"name": "echo dot"}

COCO数据集的下载

下载网址：官网下载链接

coco数据集详解的更多相关文章

BAL数据集详解
详细格式:https://grail.cs.washington.edu/projects/bal/ Bundle Adjustment in the Large Recent work in Str ...
coco标注信息与labelme标注信息的详解、相互转换及可视化
引言在做实例分割或语义分割的时候,我们通常要用labelme进行标注,labelme标注的json文件与coco数据集已经标注好的json文件的格式和内容有差异.如果要用coco数据集的信息,就要对 ...
BI之SSAS完整实战教程5 -- 详解多维数据集结构
之前简单介绍过多维数据集(Cube)的结构. 原来计划将Cube结构这部分内容打散,在实验中穿插讲解, 考虑到结构之间不同的部分都有联系,如果打散了将反而不好理解,还是直接一次性全部讲完. 本篇我们将 ...
全网最详细的大数据集群环境下多个不同版本的Cloudera Hue之间的界面对比（图文详解）
不多说,直接上干货! 为什么要写这么一篇博文呢? 是因为啊,对于Hue不同版本之间,其实,差异还是相对来说有点大的,具体,大家在使用的时候亲身体会就知道了,比如一些提示和界面. 安装Hue后的一些功能 ...
全网最详细的大数据集群环境下如何正确安装并配置多个不同版本的Cloudera Hue（图文详解）
不多说,直接上干货! 为什么要写这么一篇博文呢? 是因为啊,对于Hue不同版本之间,其实,差异还是相对来说有点大的,具体,大家在使用的时候亲身体会就知道了,比如一些提示和界面. 全网最详细的大数据集群 ...
Ubuntu14.04下Ambari安装搭建部署大数据集群（图文分五大步详解）（博主强烈推荐）
不多说,直接上干货! 写在前面的话 (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责.认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentO ...
Ubuntu14.04下Cloudera安装搭建部署大数据集群（图文分五大步详解）（博主强烈推荐）（在线或离线）
第一步: Cloudera Manager安装之Cloudera Manager安装前准备(Ubuntu14.04)(一) 第二步: Cloudera Manager安装之时间服务器和时间客户端(Ub ...
关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得（图文详解）
写在前面的话 (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责.认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentOS6.5版本)和clo ...
snort + barnyard2如何正确读取snort.unified2格式的数据集并且入库MySQL（图文详解）
不多说,直接上干货! 为什么,要写这篇论文? 是因为,目前科研的我,正值研三,致力于网络安全.大数据.机器学习研究领域! 论文方向的需要,同时不局限于真实物理环境机器实验室的攻防环境.也不局限于真实物 ...
Oracle创建表语句(Create table)语法详解及示例、、 C# 调用Oracle 存储过程返回数据集实例
Oracle创建表语句(Create table)语法详解及示例 2010-06-28 13:59:13| 分类: Oracle PL/SQL|字号订阅创建表(Create table)语法详解 ...

随机推荐

win10家庭版升级到专业版密钥
J7QT3-3GCPG-9GVWT-CH2XR-GMRJM
解决pip命令报错及Python环境配置指南：从安装到优化
1. 错误日志当我在 Linux 机器(使用 Debian 或 Ubuntu 或衍生发行版)上运行 pip install xyz 时,会出现这样的错误: error: externally-man ...
百度高效研发实战训练营-Step4
百度高效研发实战训练营-Step4 4.1 代码检测规则:Java案例详解以Java的案例进行代码检查规则解释,代码检测规则可以分为以下十类: 4.1.1 源文件规范该类规范,主要为从文件名.文件 ...
使用学生优惠创建 Azure Database for MySQL 数据库
前言在此之前,你需要拥有一个已通过学生认证的 Azure 账户.关于通过 Azure 学生认证,网上已有大量教程,此处不再赘述. 前些日子认证通过了 Azure 的学生认证,在部署此网站时发现 Az ...
解决Playwright访问https证书问题
# 参数说明 ignore_https_errors=True 访问https地址解决安全证书 viewport={"width": 1920, "height" ...
[rustGUI][iced]基于rust的GUI库iced（0.13）的部件学习（01）：为窗口设置布局（column、row）
前言本文是关于iced库的部件介绍,iced库是基于rust的GUI库,作者自述是受Elm启发. iced目前的版本是0.13.1,相较于此前的0.12版本,有较大改动. 本合集是基于新版本的关于分 ...
让 LLM 来评判 | 基础概念
基础概念这是让 LLM 来评判系列文章的第一篇,敬请关注系列文章: 基础概念选择 LLM 评估模型设计你自己的评估 prompt 评估你的评估结果奖励模型相关内容技巧与提示什么是评估模 ...
Netty3 核心代码-copy
Netty Hello Word-copy 概述https://github.com/csy512889371/learndemo/netty/NettyHellonetty版本大致版本分为 ne ...
biancheng-linux-shell
参考http://c.biancheng.net/view/706.html Shell变量:Shell变量的定义.赋值和删除 Shell 支持以下三种定义变量的方式: variable=valuev ...
.NET 数据拷贝方案选择
应用中我们经常使用到数据的复制,在.NET中有多种方式可以实现复制数据或对象.选择哪种方式通.是浅拷贝还是深拷贝,取决于对象的复杂性.数据量以及具体需求场景. 1. MemberwiseClone拷贝 ...

coco数据集详解