SSD目标检测实战(TF项目)——人脸检测2
数据转化为VOC格式:
一、我们先看 VOC格式的数据是什么???

Annotations:存放xml 包括 文件夹信息 图片名称、 图片尺寸信息、 图片中object的信息。
JPEGImages: 存放图片 二、分析Wider FACE数据集: 数据集中的txt中信息为:
第一行: 图片路径
第二行:多少个人脸
第三行:bbox信息 存储的左上角 坐标 和 高度宽度
三、代码转换:
import os,cv2,sys,shutil from xml.dom.minidom import Document def writexml(filename,saveimg,bboxes,xmlpath,typename):
#xml打包的函数,我们不需要知道内部做了什么。
#我们只需要将图片名称 图片信息 bbox信息 最终存储信息 作为参数 就可以了
#不需要做修改 doc = Document() #定义文件对象
annotation = doc.createElement('annotation') #创建根节点
doc.appendChild(annotation) #存放在doc中
# 定义annotation 的子节点
folder = doc.createElement('folder') folder_name = doc.createTextNode('widerface')
folder.appendChild(folder_name)
annotation.appendChild(folder)
filenamenode = doc.createElement('filename')
filename_name = doc.createTextNode(filename)
filenamenode.appendChild(filename_name)
annotation.appendChild(filenamenode)
source = doc.createElement('source')
annotation.appendChild(source)
database = doc.createElement('database')
database.appendChild(doc.createTextNode('wider face Database'))
source.appendChild(database)
annotation_s = doc.createElement('annotation')
annotation_s.appendChild(doc.createTextNode('PASCAL VOC2007'))
source.appendChild(annotation_s)
image = doc.createElement('image')
image.appendChild(doc.createTextNode('flickr'))
source.appendChild(image)
flickrid = doc.createElement('flickrid')
flickrid.appendChild(doc.createTextNode('-1'))
source.appendChild(flickrid)
owner = doc.createElement('owner')
annotation.appendChild(owner)
flickrid_o = doc.createElement('flickrid')
flickrid_o.appendChild(doc.createTextNode('yanyu'))
owner.appendChild(flickrid_o)
name_o = doc.createElement('name')
name_o.appendChild(doc.createTextNode('yanyu'))
owner.appendChild(name_o) size = doc.createElement('size')
annotation.appendChild(size) width = doc.createElement('width')
width.appendChild(doc.createTextNode(str(saveimg.shape[1])))
height = doc.createElement('height')
height.appendChild(doc.createTextNode(str(saveimg.shape[0])))
depth = doc.createElement('depth')
depth.appendChild(doc.createTextNode(str(saveimg.shape[2]))) size.appendChild(width) size.appendChild(height)
size.appendChild(depth)
segmented = doc.createElement('segmented')
segmented.appendChild(doc.createTextNode(''))
annotation.appendChild(segmented)
for i in range(len(bboxes)):
bbox = bboxes[i]
objects = doc.createElement('object')
annotation.appendChild(objects)
object_name = doc.createElement('name')
object_name.appendChild(doc.createTextNode(typename[i])) #人脸数据的话 直接为 “face”
objects.appendChild(object_name)
pose = doc.createElement('pose')
pose.appendChild(doc.createTextNode('Unspecified'))
objects.appendChild(pose)
truncated = doc.createElement('truncated')
truncated.appendChild(doc.createTextNode(''))
objects.appendChild(truncated)
difficult = doc.createElement('difficult')
difficult.appendChild(doc.createTextNode(''))
objects.appendChild(difficult)
bndbox = doc.createElement('bndbox')
objects.appendChild(bndbox)
xmin = doc.createElement('xmin')
xmin.appendChild(doc.createTextNode(str(bbox[0])))
bndbox.appendChild(xmin)
ymin = doc.createElement('ymin')
ymin.appendChild(doc.createTextNode(str(bbox[1])))
bndbox.appendChild(ymin)
xmax = doc.createElement('xmax')
xmax.appendChild(doc.createTextNode(str(bbox[2])))# bbox[0] +
bndbox.appendChild(xmax)
ymax = doc.createElement('ymax')
ymax.appendChild(doc.createTextNode(str(bbox[3])))# bbox[1] +
bndbox.appendChild(ymax)
f = open(xmlpath, "w")
f.write(doc.toprettyxml(indent=''))
f.close() rootdir = "/media/kuan/新加卷/wider_face" #定义数据集的根目录wider_face 下载好的 def convertimgset(img_set): #解析函数 img_set 作为解析的路径 img_sets = ["train","val"]
imgdir = rootdir + "/WIDER_" + img_set + "/images" #图片文件的路径
gtfilepath = rootdir + "/wider_face_split/wider_face_" + img_set + "_bbx_gt.txt" #标注信息
fwrite = open(rootdir + "/ImageSets/Main/" + img_set + ".txt", 'w') #写入txt中 main 底下的文件夹 对应140行
index = 0 #表示解析到第几张图
with open(gtfilepath, 'r') as gtfiles: #打开真值文件,获取bbox
while(True): #true index< 1000 #前1000个样本
filename = gtfiles.readline()[:-1] #读取一行数据, 为图像路径
if filename == None or filename == "":
break
imgpath = imgdir + "/" + filename #图片的绝对路径
img = cv2.imread(imgpath) #拿到读取图片 可以获取到shape信息
if not img.data:
break;
numbbox = int(gtfiles.readline()) #读取到了第二行 人脸个数
bboxes = []
print(numbbox)
for i in range(numbbox): #读取bbox信息 numbbox 行
line = gtfiles.readline()
lines = line.split(" ")
lines = lines[0:4] bbox = (int(lines[0]), int(lines[1]), int(lines[2]), int(lines[3])) #存储的左上角 坐标 和 高度宽度 if int(lines[2]) < 40 or int(lines[3]) < 40:
continue bboxes.append(bbox) #存放到bbox中 numbbox个人脸信息 #cv2.rectangle(img, (bbox[0],bbox[1]),(bbox[0]+bbox[2],bbox[1]+bbox[3]),color=(255,255,0),thickness=1) filename = filename.replace("/", "_") #图片的名称存储 if len(bboxes) == 0:
print("no face")
continue
#cv2.imshow("img", img)
#cv2.waitKey(0)
cv2.imwrite("{}/JPEGImages/{}".format(rootdir,filename), img) #写入图像JPEGImages
fwrite.write(filename.split(".")[0] + "\n") #写入txt中 main 底下的文件夹
xmlpath = "{}/Annotations/{}.xml".format(rootdir,filename.split(".")[0])
writexml(filename, img, bboxes, xmlpath) #调用函数
print("success number is ", index)
index += 1 fwrite.close() if __name__=="__main__":
img_sets = ["train","val"]
for img_set in img_sets:
convertimgset(img_set)
#修改文件名
shutil.move(rootdir + "/ImageSets/Main/" + "train.txt", rootdir + "/ImageSets/Main/" + "trainval.txt")
shutil.move(rootdir + "/ImageSets/Main/" + "val.txt", rootdir + "/ImageSets/Main/" + "test.txt")
通过上面三个步骤我们就生成了VOC格式的数据集,现在我们只需要放到工程目录下并且进行修改 就可以开始训练了。
详细修改方法见下:
https://www.cnblogs.com/WSX1994/p/11216953.html
SSD目标检测实战(TF项目)——人脸检测2的更多相关文章
- 人脸检测学习笔记(数据集-DLIB人脸检测原理-DLIB&OpenCV人脸检测方法及对比)
		
1.Easily Create High Quality Object Detectors with Deep Learning 2016/10/11 http://blog.dlib.net/201 ...
 - TF项目实战(基于SSD目标检测)——人脸检测1
		
SSD实战——人脸检测 Tensorflow 一 .人脸检测的困难: 1. 姿态问题 2.不同种族人, 3.光照 遮挡 带眼睛 4.视角不同 5. 不同尺度 二. 数据集介绍以及转化VOC: 1. F ...
 - 基于MATLAB的adaboost级联形式的人脸检测实现
		
很早之前就做过一些关于人脸检测和目标检测的课题,一直都没有好好总结出来,趁着这个机会,写个总结,希望所写的内容能给研究同类问题的博友一些见解和启发!!博客里面涉及的公式太繁琐了,直接截图了. 转载请注 ...
 - Android 中使用 dlib+opencv 实现动态人脸检测
		
1 概述 完成 Android 相机预览功能以后,在此基础上我使用 dlib 与 opencv 库做了一个关于人脸检测的 demo.该 demo 在相机预览过程中对人脸进行实时检测,并将检测到的人脸用 ...
 - OpenCV 学习笔记 05 人脸检测和识别
		
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
 - Android Camera2 预览,拍照,人脸检测并实时展现
		
https://www.jianshu.com/p/5414ba2b5508 背景 最近需要做一个人脸检测并实时预览的功能.就是边检测人脸,边在预览界面上框出来. 当然本人并不是专门做 ...
 - paper 90:人脸检测研究2015最新进展
		
搜集整理了2004~2015性能最好的人脸检测的部分资料,欢迎交流和补充相关资料. 1:人脸检测性能 1.1 人脸检测测评 目前有两个比较大的人脸测评网站: 1:Face Detection Data ...
 - 用caffe一步一步实现人脸检测
		
学习深度学习已有一段时间了,总想着拿它做点什么,今天终于完成了一个基于caffe的人脸检测,这篇博文将告诉你怎样通过caffe一步步实现人脸检测.本文主要参考唐宇迪老师的教程,在这里感谢老师的辛勤付出 ...
 - OpenCV神技——人脸检测,猫脸检测
		
简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...
 - 机器学习: Viola-Jones 人脸检测算法解析(一)
		
在计算机视觉领域中,人脸检测或者物体检测一直是一个非常受关注的领域,而在人脸检测中,Viola-Jones人脸检测算法可以说是非常经典的一个算法,所有从事人脸检测研究的人,都会熟悉了解这个算法,Vio ...
 
随机推荐
- Jury Compromise
			
K - Jury Compromise 参考:ACM POJ 1015 Jury Compromise(陪审团的人选,动态规划题,难) 说实话真有点难想,用一个DP[i][j]来表示在选取i个人,辩控 ...
 - 虚拟机扩展Linux根目录磁盘空间
			
简要扩展空间方法http://www.kwx.gd/CentOSApp/Xen-Centos6-Mounted-HardDrive.html 最近在VMware虚拟机上使用Centos,用着用着,发现 ...
 - windos系统下使tomcat按天生成控制台日志catalina.out
			
windos系统下的tomcat默认不会记录控制台catalina.out日志,只有访问日志,不便于排错 修改启动文件 1.打开bin下面的startup.bat文件,把 call "%EX ...
 - HTML 行内-块级-行块级
			
行内元素 相邻元素可以在一行显示直到一行排不下才进行换行. 不可设置宽高.对齐等属性,宽度随内容变化. padding和margin的设置中,水平方向(padding-left...)有效果,垂直方向 ...
 - Jinja2学习
			
模板: 知名模板引擎:jinja2(flask默认的模板引擎) Mako template模板路径: 1.在渲染模板的时候,会默认从根目录下的templates目录下查找模板文件 2.也可以自定义模板 ...
 - CSS3 新特性
			
~平时喜欢逛博客,看别人的学习总结和遇到的问题解决办法,恰好最近在做书签整理,翻到了之前一个前辈移动前端的总结,所以我就按他的总结模块对自己的知识进行了梳理,不过由于都是手写的,为了方便,下面的都是平 ...
 - leetcode1284 转化为全零矩阵的最少反转次数
			
m == mat.length n == mat[0].length 1 <= m <= 3 1 <= n <= 3 mat[i][j] 是 0 或 1 . BFS, 代码来自 ...
 - LinearLayout线性布局
			
作用 : 线性布局会将容器中的组件一个一个排列起来, LinearLayout可以控制组件横向或者纵向排列, 通过android:orientation属性控制; 不换行属性 : 线性布局中的组件不会 ...
 - 查看openstack各组件小版本号
			
查看api版本号 因为要判断openstack的某个小功能是否支持,需要确定api版本号大于某个版本,故需要查询现有环境api版本号 如查看cinder-api的版本号 指定api版本调api 在he ...
 - Pro JavaScript List.11-11
			
//为实现各种现代浏览器的requestAnimationFrame()方法,创建一段简单的跨浏览器保障代码(polyfill),以实现流畅.高效的动画.由保罗•艾里什(Paul Irish)编写,网 ...