用python将MSCOCO和Caltech行人检测数据集转化成VOC格式

Arkenstone 2024-10-29 02:11:45 原文

代码：转换用的代码放在这里

之前用Tensorflow提供的object detection API可以很方便的进行fine-tuning实现所需的特定物体检测模型（看这里）。那么现在的主要问题就是数据集了，目前公开的数据集已经有很多了，比如综合的有MSCOCO， ImageNet；人脸的有LFW，CASIA，CelebV等；行人检测的有Caltech，KITTI等；姿势检测的VGG，还有其他等等（具体按分类可以参考下这个）。总之这个数据集资源的总结有很多，在google或者github上搜下有一大堆，这里就不具体介绍了。

1. COCO数据集

这里用到的数据集是object instance/keypoints数据集，用于之后的物体检测和姿势检测，可以在这里进行下载，也可以用git上coco项目提供的api。

一开始的做法是下载train2014和val2014图片数据集，然后根据instance/keypoints annotation (json)文件根据图片名从中匹配出所需的图片。不过后来发现annotation中的链接不一定能在下载的数据集里面找到，需要自行下载，所以最后的做法是直接从annotation文件中提取图片名跟下载链接然后下载进行匹配。coco比Imagenet好的一点是除了图片flickr链接之外还提供了coco源的链接（比如：http://mscoco.org/images/472），前者在开几个线程爬取图片的时候很可能会被封，后者就随意多了，爬取速度可以很快。

使用:
MSCOCO数据集的注释说明很清楚，转换脚本很容易写。用上面的库里的anno_json_image_urls.py从annotation文件获取图片链接，然后用download_coco_images.py下载图片以及anno_coco2voc.py生产voc格式的xml注释文件。

2. Caltech pedestrian数据集

这个数据集提供的图片文件存在seq中，注释文件是vbb（是这群dalao用matlab写的），开始还以为需要用matlab进行处理了，不过后来发现用scipy.io.loadmat函数可以读取vbb文件，用opencv的cv2.VideoCapture()可以读取seq，那么就可以直接用python来转换而非matlab。当然如果对matlab很熟的话，可以直接用官方提供的toolbox。

不过这个数据集的annotation文件的说明文档我好像没有找到，所以vbb文件的数据格式并不是很清楚，通过直接加载以后查看能够知道里面提供了一大堆字段比如id（类型：person，people, person-far这种），pos（位置，就是我们需要的），occl（是否遮挡，可能有用），lock， posv（这两个不太清楚是啥也没怎么查到，有人查到可以留言下哈）。

使用：
用上面库里的vbb2voc脚本可以将下载的seq和vbb文件转换成jpg和xml文件(不过这个数据集的下载有点麻烦，可能需要FQ)。

参考

用python将MSCOCO和Caltech行人检测数据集转化成VOC格式的更多相关文章

从TP、FP、TN、FN到ROC曲线、miss rate、行人检测评估
从TP.FP.TN.FN到ROC曲线.miss rate.行人检测评估想要在行人检测的evaluation阶段要计算miss rate,就要从True Positive Rate讲起:miss ra ...
CVPR 2019 行人检测新思路：
CVPR 2019 行人检测新思路:高级语义特征检测取得精度新突破原创: CV君我爱计算机视觉今天点击我爱计算机视觉置顶或标星,更快获取CVML新技术今天跟大家分享一篇昨天新出的CVPR 2 ...
行人检测与重识别！SOTA算法
行人检测与重识别!SOTA算法 A Simple Baseline for Multi-Object Tracking, Yifu Zhang, Chunyu Wang, Xinggang Wang, ...
paper 87：行人检测资源（下）代码数据【转载，以后使用】
这是行人检测相关资源的第二部分:源码和数据集.考虑到实际应用的实时性要求,源码主要是C/C++的.源码和数据集的网址,经过测试都可访问,并注明了这些网址最后更新的日期,供学习和研究进行参考.(欢迎补充 ...
行人检测(Pedestrian Detection)资源
一.论文综述类的文章 [1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the stat ...
【论文解读】行人检测：What Can Help Pedestrian Detection?（CVPR'17）
前言本篇文章出自CVPR2017,四名作者为Tsinghua University,Peking University, 外加两名来自Megvii(旷视科技)的大佬. 文章中对能够帮助行人检测的ex ...
目标检测之行人检测（Pedestrian Detection）---行人检测之简介0
一.论文综述类的文章 [1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the stat ...
【计算机视觉】行人检测(Pedestrian Detection)资源
一.论文综述类的文章 [1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the stat ...
基于YOLO-V2的行人检测（自训练）附pytorch安装方法
声明:本文是别人发表在github上的项目,并非个人原创,因为那个项目直接下载后出现了一些版本不兼容的问题,故写此文帮助解决.(本人争取在今年有空的时间,自己实现基于YOLO-V4的行人检测) 项目链 ...

随机推荐

【Unity】制作简易定时器（Timer）
最近开始学习Unity,也想开始学习写一些简单的博客. 在网上学习了一些关于定时器的写法,在此简单总结一下,方便自己以后用到时查阅. 需求:制作定时器,运行3秒后执行第一次,之后每隔3秒执行一次操作. ...
C语言 · 生物芯片
标题:生物芯片 X博士正在研究一种生物芯片.博士在芯片中设计了 n 个微型光源,每个光源操作一次就会改变其状态,即:点亮转为关闭,或关闭转为点亮. 这些光源的编号从 1 到 n,开始的时候所有光源都是 ...
java 、HashMap 和单例
前段时间在项目中遇到一个问题.当多个系统同时运行时,大部分系统能够良好运转,部分却卡死在了启动界面.以下是我解决该问题的步骤和总结: 1.复现问题.重新走了一遍出问题的过程,发现问题的确存在.说明 ...
android 避免线程的重复创建(HandlerThread、线程池）
最近在android开发中,用到都是new Thread(){...}.start()这种方式.本来这样是可以,但是最近突然爆出Performing stop of activity that is ...
sparkR的一个运行的例子
在sparkR在配置完成的基础上,本例采用Spark on yarn模式,介绍sparkR运行的一个例子. 在spark的安装目录下,/examples/src/main/r,有一个dataframe ...
Python 文件操作三
文件重命名os模块中的rename()可以完成对文件的重命名操作rename(需要修改的文件名, 新的文件名) import os os.rename("11.txt", &quo ...
C++ 结构体初始化
#include <stdio.h> int main(int argc, const char * argv[]) { //定义结构体类型 struct Person { char *n ...
C++标准转换运算符static_cast
该运算符把expression转换为type-id类型,但没有运行时类型检查来保证转换的安全性. 中文名暂无外文名 static_cast 分类强制类型转换类型 C++ s ...
关于Unity中蒙皮网格和布料的使用
所以物体的要绘制出来就必须要有网格组件+材质属性,如果还需要其他特效或丰富内容的话,还可以再加组件. 蒙皮网格和布料 1: 例如要模拟衣服,随风摆动,模拟布料需要用到蒙皮网格和布料;2: 蒙皮网格可以 ...
Android WiFi 日志记录(四次握手)
记录一下四次握手的log. PMK: PMK(Pairwise Master Key,成对主密钥 STA和AP得到PMK后,将进行密匙派生以得到PTK.最后,PTK被设置到硬件中, 用于数据的加解密. ...