SSD目标检测实战（TF项目）—

数据转化为VOC格式：

一、我们先看 VOC格式的数据是什么？？？

Annotations：存放xml  包括 文件夹信息   图片名称、 图片尺寸信息、 图片中object的信息。

JPEGImages：   存放图片

二、分析Wider FACE数据集：

数据集中的txt中信息为：
第一行： 图片路径
第二行：多少个人脸
第三行：bbox信息   存储的左上角 坐标 和 高度宽度

三、代码转换：

 import os,cv2,sys,shutil

 from xml.dom.minidom import Document

 def writexml(filename,saveimg,bboxes,xmlpath,typename):

     #xml打包的函数，我们不需要知道内部做了什么。

     #我们只需要将图片名称   图片信息   bbox信息    最终存储信息 作为参数 就可以了

     #不需要做修改

     doc = Document()                                #定义文件对象

     annotation = doc.createElement('annotation')  #创建根节点

     doc.appendChild(annotation)    #存放在doc中

     # 定义annotation 的子节点

     folder = doc.createElement('folder')

     folder_name = doc.createTextNode('widerface')

     folder.appendChild(folder_name)

     annotation.appendChild(folder)

     filenamenode = doc.createElement('filename')

     filename_name = doc.createTextNode(filename)

     filenamenode.appendChild(filename_name)

     annotation.appendChild(filenamenode)

     source = doc.createElement('source')

     annotation.appendChild(source)

     database = doc.createElement('database')

     database.appendChild(doc.createTextNode('wider face Database'))

     source.appendChild(database)

     annotation_s = doc.createElement('annotation')

     annotation_s.appendChild(doc.createTextNode('PASCAL VOC2007'))

     source.appendChild(annotation_s)

     image = doc.createElement('image')

     image.appendChild(doc.createTextNode('flickr'))

     source.appendChild(image)

     flickrid = doc.createElement('flickrid')

     flickrid.appendChild(doc.createTextNode('-1'))

     source.appendChild(flickrid)

     owner = doc.createElement('owner')

     annotation.appendChild(owner)

     flickrid_o = doc.createElement('flickrid')

     flickrid_o.appendChild(doc.createTextNode('yanyu'))

     owner.appendChild(flickrid_o)

     name_o = doc.createElement('name')

     name_o.appendChild(doc.createTextNode('yanyu'))

     owner.appendChild(name_o)

     size = doc.createElement('size')

     annotation.appendChild(size)

     width = doc.createElement('width')

     width.appendChild(doc.createTextNode(str(saveimg.shape[1])))

     height = doc.createElement('height')

     height.appendChild(doc.createTextNode(str(saveimg.shape[0])))

     depth = doc.createElement('depth')

     depth.appendChild(doc.createTextNode(str(saveimg.shape[2])))

     size.appendChild(width)

     size.appendChild(height)

     size.appendChild(depth)

     segmented = doc.createElement('segmented')

     segmented.appendChild(doc.createTextNode(''))

     annotation.appendChild(segmented)

     for i in range(len(bboxes)):

         bbox = bboxes[i]

         objects = doc.createElement('object')

         annotation.appendChild(objects)

         object_name = doc.createElement('name')

         object_name.appendChild(doc.createTextNode(typename[i]))  #人脸数据的话 直接为 “face”

         objects.appendChild(object_name)

         pose = doc.createElement('pose')

         pose.appendChild(doc.createTextNode('Unspecified'))

         objects.appendChild(pose)

         truncated = doc.createElement('truncated')

         truncated.appendChild(doc.createTextNode(''))

         objects.appendChild(truncated)

         difficult = doc.createElement('difficult')

         difficult.appendChild(doc.createTextNode(''))

         objects.appendChild(difficult)

         bndbox = doc.createElement('bndbox')

         objects.appendChild(bndbox)

         xmin = doc.createElement('xmin')

         xmin.appendChild(doc.createTextNode(str(bbox[0])))

         bndbox.appendChild(xmin)

         ymin = doc.createElement('ymin')

         ymin.appendChild(doc.createTextNode(str(bbox[1])))

         bndbox.appendChild(ymin)

         xmax = doc.createElement('xmax')

         xmax.appendChild(doc.createTextNode(str(bbox[2])))#  bbox[0] +

         bndbox.appendChild(xmax)

         ymax = doc.createElement('ymax')

         ymax.appendChild(doc.createTextNode(str(bbox[3])))#  bbox[1] +

         bndbox.appendChild(ymax)

     f = open(xmlpath, "w")

     f.write(doc.toprettyxml(indent=''))

     f.close()

 rootdir = "/media/kuan/新加卷/wider_face"  #定义数据集的根目录wider_face  下载好的

 def convertimgset(img_set):  #解析函数 img_set 作为解析的路径    img_sets = ["train","val"]

     imgdir = rootdir + "/WIDER_" + img_set + "/images"                                   #图片文件的路径

     gtfilepath = rootdir + "/wider_face_split/wider_face_" + img_set + "_bbx_gt.txt"  #标注信息

     fwrite = open(rootdir + "/ImageSets/Main/" + img_set + ".txt", 'w')  #写入txt中 main 底下的文件夹 对应140行

     index = 0    #表示解析到第几张图

     with open(gtfilepath, 'r') as gtfiles:      #打开真值文件，获取bbox

         while(True):                            #true   index< 1000 #前1000个样本

             filename = gtfiles.readline()[:-1]         #读取一行数据， 为图像路径

             if filename == None or filename == "":

                 break

             imgpath = imgdir + "/" + filename         #图片的绝对路径

             img = cv2.imread(imgpath)                 #拿到读取图片   可以获取到shape信息

             if not img.data:

                 break;

             numbbox = int(gtfiles.readline())         #读取到了第二行    人脸个数

             bboxes = []

             print(numbbox)

             for i in range(numbbox):                 #读取bbox信息  numbbox 行

                 line = gtfiles.readline()

                 lines = line.split(" ")

                 lines = lines[0:4]

                 bbox = (int(lines[0]), int(lines[1]), int(lines[2]), int(lines[3]))  #存储的左上角 坐标 和 高度宽度

                 if int(lines[2]) < 40 or int(lines[3]) < 40:

                     continue

                 bboxes.append(bbox)             #存放到bbox中   numbbox个人脸信息

                 #cv2.rectangle(img, (bbox[0],bbox[1]),(bbox[0]+bbox[2],bbox[1]+bbox[3]),color=(255,255,0),thickness=1)

             filename = filename.replace("/", "_")    #图片的名称存储

             if len(bboxes) == 0:

                 print("no face")

                 continue

             #cv2.imshow("img", img)

             #cv2.waitKey(0)

             cv2.imwrite("{}/JPEGImages/{}".format(rootdir,filename), img)  #写入图像JPEGImages

             fwrite.write(filename.split(".")[0] + "\n")     #写入txt中 main 底下的文件夹

             xmlpath = "{}/Annotations/{}.xml".format(rootdir,filename.split(".")[0])

             writexml(filename, img, bboxes, xmlpath)   #调用函数

             print("success number is ", index)

             index += 1

     fwrite.close()

 if __name__=="__main__":

     img_sets = ["train","val"]

     for img_set in img_sets:

         convertimgset(img_set)

     #修改文件名

     shutil.move(rootdir + "/ImageSets/Main/" + "train.txt", rootdir + "/ImageSets/Main/" + "trainval.txt")

     shutil.move(rootdir + "/ImageSets/Main/" + "val.txt", rootdir + "/ImageSets/Main/" + "test.txt")

通过上面三个步骤我们就生成了VOC格式的数据集，现在我们只需要放到工程目录下并且进行修改就可以开始训练了。

详细修改方法见下：

https://www.cnblogs.com/WSX1994/p/11216953.html

SSD目标检测实战（TF项目）——人脸检测2的更多相关文章

人脸检测学习笔记（数据集-DLIB人脸检测原理-DLIB&OpenCV人脸检测方法及对比）
1.Easily Create High Quality Object Detectors with Deep Learning 2016/10/11 http://blog.dlib.net/201 ...
TF项目实战（基于SSD目标检测）——人脸检测1
SSD实战——人脸检测 Tensorflow 一 .人脸检测的困难: 1. 姿态问题 2.不同种族人, 3.光照遮挡带眼睛 4.视角不同 5. 不同尺度二. 数据集介绍以及转化VOC: 1. F ...
基于MATLAB的adaboost级联形式的人脸检测实现
很早之前就做过一些关于人脸检测和目标检测的课题,一直都没有好好总结出来,趁着这个机会,写个总结,希望所写的内容能给研究同类问题的博友一些见解和启发!!博客里面涉及的公式太繁琐了,直接截图了. 转载请注 ...
Android 中使用 dlib+opencv 实现动态人脸检测
1 概述完成 Android 相机预览功能以后,在此基础上我使用 dlib 与 opencv 库做了一个关于人脸检测的 demo.该 demo 在相机预览过程中对人脸进行实时检测,并将检测到的人脸用 ...
OpenCV 学习笔记 05 人脸检测和识别
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
Android Camera2 预览，拍照，人脸检测并实时展现
https://www.jianshu.com/p/5414ba2b5508 背景最近需要做一个人脸检测并实时预览的功能.就是边检测人脸,边在预览界面上框出来. 当然本人并不是专门做 ...
paper 90：人脸检测研究2015最新进展
搜集整理了2004~2015性能最好的人脸检测的部分资料,欢迎交流和补充相关资料. 1:人脸检测性能 1.1 人脸检测测评目前有两个比较大的人脸测评网站: 1:Face Detection Data ...
用caffe一步一步实现人脸检测
学习深度学习已有一段时间了,总想着拿它做点什么,今天终于完成了一个基于caffe的人脸检测,这篇博文将告诉你怎样通过caffe一步步实现人脸检测.本文主要参考唐宇迪老师的教程,在这里感谢老师的辛勤付出 ...
OpenCV神技——人脸检测，猫脸检测
简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...
机器学习: Viola-Jones 人脸检测算法解析(一)
在计算机视觉领域中,人脸检测或者物体检测一直是一个非常受关注的领域,而在人脸检测中,Viola-Jones人脸检测算法可以说是非常经典的一个算法,所有从事人脸检测研究的人,都会熟悉了解这个算法,Vio ...

随机推荐

使用io/ioutil进行读写文件
读文件: package main import ( "fmt" "io/ioutil" ) func main() { b, err := ioutil.Re ...
java按某个字段对数据分组
import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; i ...
IDEA如何切换到括号外
一般我们输入完括号后都会习惯性Enter或者Shift + Enter切换到括号外,结果却变成了: public void nothing() Enter → public void nothing( ...
QObject 的拷贝构造和赋值操作
QOject 中没有提供一个拷贝构造函数和赋值操作符给外界使用,其实拷贝构造和赋值的操作都是已经声明了的,但是它们被使用了Q_DISABLE_COPY () 宏放在了private区域.因此所有继承自 ...
移动端页面字体——rem的使用
浏览器的默认字体高是16px. 兼容性: 目前,IE9+,Firefox.Chrome.Safari.Opera 的主流版本都支持了rem. 对于不支持的浏览器,要多写一个绝对单位的声明,这样浏览器就 ...
Node.JS数组及For 语句
for Each语句: var arr = ["Zhang San", "Li Si", "Wang Wu"] arr.forEach(fu ...
js 中 new call apply bind JSON.stringify 的原理以及模拟实现
1.new的原理和实现它创建了一个全新的对象. 它会被执行 [[Prototype]](也就是 __proto__)链接. 它使 this指向新创建的对象. 通过 new创建的每个对象将最终被 [[ ...
Python异步IO之协程(二):使用asyncio的不同方法实现协程
引言:在上一章中我们介绍了从yield from的来源到async的使用,并在最后以asyncio.wait()方法实现协程,下面我们通过不同控制结构来实现协程,让我们一起来看看他们的不同作用吧- 在 ...
#dokcer部署code-server web版vscode+golang
codercom/code-server:latest不支持插件在线安装 codercom/code-server:v2目前为最新版1. #创建 docker rm -f vscode docker ...
delphi数据集查找不定位
procedure TForm1.Button2Click(Sender: TObject); var R: Variant; begin R := MemTableEh1.Lookup('Name' ...

SSD目标检测实战（TF项目）——人脸检测2

SSD目标检测实战（TF项目）——人脸检测2的更多相关文章

随机推荐

热门专题