目标检测数据库 PASCAL 格式的 Ground Truth 的解析函数

最近在做一个目标检测算法，训练时用到了 bootstrap 策略，于是我将PASCAL的 Ground Truth 格式的读取函数从 Matlab 改写为 C++。PASCAL 的标注格式为：

# PASCAL Annotation Version 1.00

Image filename : "对应图片路径"
Image size (X x Y x C) : 宽 x 高 x 3
Database : "数据库名称"
Objects with ground truth : 1 { "PASperson" }

# Note that there might be other objects in the image
# for which ground truth data has not been provided.

# Top left pixel co-ordinates : (0, 0)

# Details for object 1 ("PASperson")
# Center point -- not available in other PASCAL databases -- refers
# to person head center
Original label for object 1 "PASperson" : "UprightPerson"
Center point on object 1 "PASperson" (X, Y) : (257, 187)
Bounding box for object 1 "PASperson" (Xmin, Ymin) - (Xmax, Ymax) : (195, 154) - (297, 468)

我写的函数如下：

#include "stdio.h"

#include "string.h"

#include "stdlib.h"

// object bounding rect

struct GtRect {

    int x_min; int y_min;

    int x_max; int y_max;

};

// ground truth of one image

struct GtRecord {

    char* image_name;

    GtRect* objs;

    int obj_num; int height;

    int width; int channels;

};

// return true if c is in char set s

int _is_chars(char c, const char* s, int n)

{

    for (int i = ; i != n; ++i) {

        if (s[i] == c) {

            return ;

        }

    }

    return ;

}

void _trim_l(char* inout, const char* s)

{

    int len = strlen(inout);

    int s_len = strlen(s);

    int i = ;

    for (;i != len; ++i) {

        if (!_is_chars(inout[i], s, s_len)) {

            break;

        }

    }

    int d = i;

    int new_len = len - d;

    for (i = ; i != new_len; ++i) {

        inout[i] = inout[i + d];

    }

    inout[new_len] = '\0';

}

void _trim_r(char* inout, const char* s)

{

    int len = strlen(inout);

    int s_len = strlen(s);

    int i = len - ;

    for (;i != -; --i) {

        if (!_is_chars(inout[i], s, s_len)) {

            break;

        }

    }

    inout[i + ] = '\0';

}

inline void _trim_lr(char* inout, const char* s)

{

    _trim_l(inout, s);

    _trim_r(inout, s);

}

// read ground truth (pascal format)

//************************************

// Name:  gt_pascal_read

// Returns:   GtRecord

// const char * path    :    groundtruth file path

//************************************

GtRecord gt_pascal_read(const char* path)

{

    GtRecord ret = {, , , , , };

    FILE* f;

    fopen_s(&f, path, "r");

    int obj_num = ;

    int len = ;

    GtRect rct;

    while (fgets(BUF1, , f) != ) {

        int match_type = _match_attr(BUF1);

        switch (match_type) {

        case :

            // read image filename

            sscanf_s(BUF1, _GT_ATTR[], BUF2, );

            _trim_lr(BUF2, "\n\" ");

            len = strlen(BUF2);

            ret.image_name = (char*)malloc(len + );

            memcpy(ret.image_name, BUF2, len + );

            break;

        case :

            // read image size, channel

            sscanf_s(BUF1, _GT_ATTR[], &ret.width, &ret.height,

                &ret.channels);

            break;

        case :

            // ignore database name

            break;

        case :

            sscanf_s(BUF1, _GT_ATTR[], &rct.x_min,

                &rct.y_min, &rct.x_max, &rct.y_max);

            OBJ_BUF[obj_num++] = rct;

            break;

        case :

            // ignore polygon

        case :

            // ignore pixel map

        case :

            // ignore label

            break;

        }

    }

    fclose(f);

    ret.obj_num = obj_num;

    if (obj_num > ) {

        ret.objs = (GtRect*)malloc(sizeof(GtRect) * obj_num);

        memcpy(ret.objs, OBJ_BUF, obj_num * sizeof(GtRect));

    }

    return ret;

}

// release pascal ground truth

//************************************

// Name:  gt_pascal_release

// Returns:   void

// GtRecord * r

//************************************

void gt_pascal_release(GtRecord* r)

{

    free(r->image_name);

    free(r->objs);

    r->image_name = ;

    r->objs = ;

    r->width = ;

    r->height = ;

    r->channels = ;

    r->obj_num = ;

}

gt_pascal_read 函数忽略了 groundtruth 文件中的一些属性，例如数据库名称等，如果要加回，可以在函数的几个空的 case 中添加即可。PASCAL 官方提供了几个有用的 Matlab 脚本用于读取和生成这样的 groundtruth 文件，在算法开发的过程中要多利用这样的工具。

目标检测数据库 PASCAL 格式的 Ground Truth 的解析函数的更多相关文章

目标检测模型的性能评估--MAP（Mean Average Precision）
目标检测模型中性能评估的几个重要参数有精确度,精确度和召回率.本文中我们将讨论一个常用的度量指标:均值平均精度,即MAP. 在二元分类中,精确度和召回率是一个简单直观的统计量,但是在目标检测中有所不同 ...
[炼丹术]YOLOv5目标检测学习总结
Yolov5目标检测训练模型学习总结一.YOLOv5介绍 YOLOv5是一系列在 COCO 数据集上预训练的对象检测架构和模型,代表Ultralytics 对未来视觉 AI 方法的开源研究,结合了在 ...
【计算机视觉】目标检测中的指标衡量Recall与Precision
[计算机视觉]目标检测中的指标衡量Recall与Precision 标签(空格分隔): [图像处理] 说明:目标检测性能指标Recall与Precision的理解. Recall与Precision ...
目标检测之YOLO V1
前面介绍的R-CNN系的目标检测采用的思路是:首先在图像上提取一系列的候选区域,然后将候选区域输入到网络中修正候选区域的边框以定位目标,对候选区域进行分类以识别.虽然,在Faster R-CNN中利用 ...
paddlepaddle目标检测之水果检测（yolov3_mobilenet_v1）
一.创建项目 (1)进入到https://aistudio.baidu.com/aistudio/projectoverview/public (2)创建项目点击添加数据集:找到这两个然后创建即可 ...
深度学习与CV教程(13) | 目标检测 (SSD,YOLO系列)
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/37 本文地址:http://www.showmeai.tech/article-det ...
zz目标检测
deep learning分类目标检测-HyperNet-论文笔记 06-06 基础DL模型-Deformable Convolutional Networks-论文笔记 06-05 基础DL模型- ...
（转）技术揭秘：海康威视PASCAL VOC2012目标检测权威评测夺冠之道
技术揭秘:海康威视PASCAL VOC2012目标检测权威评测夺冠之道原创 2016-09-21 钟巧勇深度学习大讲堂点击上方“深度学习大讲堂”可订阅哦!深度学习大讲堂是高质量原创内容平台,邀请 ...
目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练
将目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练. import xml.etree.ElementTree as ET import numpy as ...

随机推荐

Python学习笔记：字典型的数据结构
根据书上的定义,字典是将数据与键相关联,这个键相当于是一组数据的一个名称,键必须是唯一的. python中提供了内置的映射类型--字典.映射其实就是一组key和value以及之间的映射函数,其特点是: ...
用公共key实现无密码ssh
1.在主服务器master下生成密钥 $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa 2.将密钥放在 ~/.ssh/authorized_keys $ cat ~ ...
mysql数据库集群
mysql数据库集群主要有2种常用方案: replication:速度快.弱一致性.适合保存低价值的数据,主要应用于日志.新闻.帖子等系统. PXC:速度慢.强一致性.适合保存高价值的数据,主要应用于 ...
Hidden的应用
在写jsp中如果一个请求的参数(例如:paramTypeCode)不能在另一个请求中使用,我们为了能让他在请求中使用可以利用隐藏域来表示,下面介绍他的用法: 1 <input type= ...
浅谈Uep分页查询
<hy:ajaxgrid id="unitGrid" showpagerbar="true" name="unitWrap" show ...
等式变换java解法
输入一个正整数X,在下面的等式左边的数字之间添加+号或者-号,使得等式成立. 1 2 3 4 5 6 7 8 9 = X 比如: 12-34+5-67+89 = 5 1+23+4-5+6-7-8-9 ...
java：（设置编码集，密码的加密，JSTL，EL表达式，权限设置）
1.设置编码集: package cn.zzsxt.lee.web.sevlet; import java.io.IOException; import javax.servlet.ServletEx ...
微信小程序前端支付
原文地址 //index.js Page({ data: { }, //点击支付按钮进行支付 payclick: function () { var t = this; wx.login({ //获取 ...
Revo Uninstaller Pro - 真正彻底卸载软件不留垃圾的强大神器！(清理安装残留文件/注册表)
大家都知道 Windows 在卸载软件时总是不够彻底,系统C盘总会留下大量难以辨别和清理的垃圾文件和临时文件,时间长了注册表也会变得非常臃肿,不仅浪费硬盘空间,而且也会明显拖慢系统响应和启动速度. R ...
Java 浮点数的范围和精度
本篇先介绍IEEE754标准中针对浮点数的规范,然后以问答形式补充有关浮点数的知识点. (一)IEEE754标准 IEEE 754 标准即IEEE浮点数算术标准,由美国电气电子工程师学会(IEEE)计 ...

目标检测数据库 PASCAL 格式的 Ground Truth 的解析函数

目标检测数据库 PASCAL 格式的 Ground Truth 的解析函数的更多相关文章

随机推荐

热门专题