python解析VOC的xml文件并转成自己需要的txt格式

在进行神经网络训练的时候，自己标注的数据集往往会有数据量不够大以及代表性不强等问题，因此我们会采用开源数据集作为训练，开源数据集往往具有特定的格式，如果我们想将开源数据集为我们所用的话，就需要对其格式进行解析，然后转成自己需要的格式，数据转换的过程其实并没有太多的技术性的东西，主要涉及的就是文件的读写操作以及一点点逻辑，之前都会首选Matlab做这样的工作，但是开始接触python之后，尝试着用python进行，发现也十分简洁，下面介绍的就是使用python解析VOC2007的xml文件，然后将其中自己需要用到的信息写到新的txt文件中，以供自己的训练使用：

首先是VOC2007的xml文件格式如下所示，我需要将这样的xml描述转成为txt形式的描述文件，并且从中筛选我所需要的几种格式

 <annotation>

     <folder>VOC2007</folder>

     <filename>000001.jpg</filename>

     <source>

         <database>The VOC2007 Database</database>

         <annotation>PASCAL VOC2007</annotation>

         <image>flickr</image>

         <flickrid>341012865</flickrid>

     </source>

     <owner>

         <flickrid>Fried Camels</flickrid>

         <name>Jinky the Fruit Bat</name>

     </owner>

     <size>

         <width>353</width>

         <height>500</height>

         <depth>3</depth>

     </size>

     <segmented>0</segmented>

     <object>

         <name>dog</name>

         <pose>Left</pose>

         <truncated>1</truncated>

         <difficult>0</difficult>

         <bndbox>

             <xmin>48</xmin>

             <ymin>240</ymin>

             <xmax>195</xmax>

             <ymax>371</ymax>

         </bndbox>

     </object>

     <object>

         <name>person</name>

         <pose>Left</pose>

         <truncated>1</truncated>

         <difficult>0</difficult>

         <bndbox>

             <xmin>8</xmin>

             <ymin>12</ymin>

             <xmax>352</xmax>

             <ymax>498</ymax>

         </bndbox>

     </object>

 </annotation>

下面就是解析上述xml文件的python脚本，如下所示，主要用到了xml.etree.cElementTree这个包，具体的用法还需要在查一些资料，我就是照着别人的例子先实现了我所需要的功能。下面的代码首先从一个train.set文件中读取所有的xml的文件名，然后针对于每一个xml文件，进行解析，并存储其中我所需要的信息。

 #!/usr/bin/evn python

 #coding:utf-8

 import os

 try:

   import xml.etree.cElementTree as ET

 except ImportError:

   import xml.etree.ElementTree as ET

 import sys 

 file_srx = open("train.set")  #其中包含所有待计算的文件名

 line = file_srx.readline()

 while line:

   f = line[:-1]    # 除去末尾的换行符

   tree = ET.parse(f)     #打开xml文档

   root = tree.getroot()         #获得root节点

   print "*"*10

   filename = root.find('filename').text

   filename = filename[:-4]

   print filename

   #file_object = open(filename + ".txt", 'w') #写文件

   file_object_log = open(filename + ".log", 'w') #写文件

   flag = False

   ########################################

   for size in root.findall('size'): #找到root节点下的size节点

     width = size.find('width').text   #子节点下节点width的值

     height = size.find('height').text   #子节点下节点height的值

     print width, height

   ########################################

   for object in root.findall('object'): #找到root节点下的所有object节点

     name = object.find('name').text   #子节点下节点name的值

     print name

     bndbox = object.find('bndbox')      #子节点下属性bndbox的值

     xmin = bndbox.find('xmin').text

     ymin = bndbox.find('ymin').text

     xmax = bndbox.find('xmax').text

     ymax = bndbox.find('ymax').text

     print xmin, ymin, xmax, ymax

     if name == ("bicycle" or "motorbike"):

       #file_object.write("Cyclist" + " 0 0 0 " + xmin + ".00 " + ymin + ".00 " + xmax + ".00 " + ymax + ".00 " + "0 0 0 0 0 0 0" + "\n")

       file_object_log.write(str(float(int(xmax) - int(xmin)) * 1920.0 / float(width)) + " " + str(float(int(ymax) - int(ymin)) * 1080.0 / float(height)) + "\n")

       flag = True

     if name == ("car"):

       #file_object.write("Car" + " 0 0 0 " + xmin + ".00 " + ymin + ".00 " + xmax + ".00 " + ymax + ".00 " + "0 0 0 0 0 0 0" + "\n")

       file_object_log.write(str(float(int(xmax) - int(xmin)) * 1920.0 / float(width)) + " " + str(float(int(ymax) - int(ymin)) * 1080.0 / float(height)) + "\n")

       flag = True

     if name == ("person"):

       #file_object.write("Pedestrian" + " 0 0 0 " + xmin + ".00 " + ymin + ".00 " + xmax + ".00 " + ymax + ".00 " + "0 0 0 0 0 0 0" + "\n")

       file_object_log.write(str(float(int(xmax) - int(xmin)) * 1920.0 / float(width)) + " " + str(float(int(ymax) - int(ymin)) * 1080.0 / float(height)) + "\n")

       flag = True

   #file_object.close( )

   file_object_log.close()

   if flag == False:  #如果没有符合条件的信息，则删掉相应的txt文件以及jpg文件

     #os.remove(filename + ".txt")

     #os.remove(filename + ".jpg")

     os.remove(filename + ".log")

   line = file_srx.readline()

另外，由于使用windows系统习惯了，很多操作都是采取鼠标加键盘进行的，比如剪切+粘贴等，这些操作在文件较少的时候是十分方便的，但是当需要对大批文件进行操作的时候就没有那么方便了，比如要对上万个文件进行剪切的时候，光是选文件就要拖拽好久，而且一不小心就得重来，在这种情况下，采取dos的批处理操作就十分方便了，比如移动文件的操作（也就是剪切粘贴）只需要一个命令：move*.jpg jpg\则将当前目录下的所有后缀为jpg的文件都移动到了当前目录的下级目录jpg中，当然还有很多其他的命令语句，以后要有这样的意识，在遇到一个功能的时候，首先想一想是否能用命令或者是脚本的方式进行，这种方法在一开始的时候或许会显得比较慢，因为需要花一些时间去查找相关的命令语句，但是如果用的熟练了之后，就会大大提升效率了。

python解析VOC的xml文件并转成自己需要的txt格式的更多相关文章

python cookbook第三版学习笔记七：python解析csv,json,xml文件
CSV文件读取: Csv文件格式如下:分别有2行三列. 访问代码如下: f=open(r'E:\py_prj\test.csv','rb') f_csv=csv.reader(f) for f in ...
无废话Android之android下junit测试框架配置、保存文件到手机内存、android下文件访问的权限、保存文件到SD卡、获取SD卡大小、使用SharedPreferences进行数据存储、使用Pull解析器操作XML文件、android下操作sqlite数据库和事务（2）
1.android下junit测试框架配置单元测试需要在手机中进行安装测试 (1).在清单文件中manifest节点下配置如下节点 <instrumentation android:name= ...
使用Pull解析器生成XML文件和读取xml文件
有些时候,我们需要生成一个XML文件,生成XML文件的方法有很多,如:可以只使用一个StringBuilder组拼XML内容,然后把内容写入到文件中:或者使用DOM API生成XML文件,或者也可以使 ...
深入学习Python解析并解密PDF文件内容的方法
前面学习了解析PDF文档,并写入文档的知识,那篇文章的名字为深入学习Python解析并读取PDF文件内容的方法. 链接如下:https://www.cnblogs.com/wj-1314/p/9429 ...
深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
使用Pull解析器生成XML文件
有些时候,我们需要生成一个XML文件,生成XML文件的方法有很多,如:可以只使用一个StringBuilder组拼XML内容,然后把内容写入到文件中:或者使用DOM API生成XML文件,或者也可以使 ...
死磕Spring之IoC篇 - BeanDefinition 的解析阶段（XML 文件）
该系列文章是本人在学习 Spring 的过程中总结下来的,里面涉及到相关源码,可能对读者不太友好,请结合我的源码注释 Spring 源码分析 GitHub 地址进行阅读 Spring 版本:5.1. ...
python xml文件解析及生成xml文件
#解析一个database的xml文件 """ <databaselist type="database config"> <dat ...
python 解析与生成xml
xml.etree.ElementTree模块为xml文件的提取和建立提供了简单有效的API.下文中使用ET来代表xml.etree.ElementTree模块. XML是一种内在的分层的数据形式,展 ...

随机推荐

Windows 使用 Gogs 搭建 Git 服务器
随便说两句之前有使用 Gitblit 在Windows搭建Git服务器,用的也挺好的,可能安装起来略麻烦一点.现在全用 Gogs 在windows搭建Git服务器,主要是因界面好看,管理更方便一些. ...
python concurrent.futures.Threadpoolexcutor的有界队列和无界队列
1.默认是无界队列,如果生产任务的速度大大超过消费的速度,则会把生产任务无限添加到无界队列中,这样一来控制不了生产速度,二来是会造成系统内存会被队列中的元素堆积增多而耗尽. 2.改写为有界队列 cla ...
[Laravel] 12 - WEB API : cache implement
前言 Ref: https://www.imooc.com/video/2873 服务端如何为客户端(app)的首页提供数据接口, 本篇用此作为例子演示接口的实现. 单例模式一.三大原则单例实现 ...
由n个元素组成的数组，n-2个数出现了偶数次，两个数出现了奇数次，且这两个数不相等，如何用O(1)的空间复杂度，找出这两个数
思路分析: 方法一:涉及到两个数,就要用到异或定理了:若a^b=x,则a=b^x,b=x^a.对于这道题,假设这两个数分别为a.b,将数组中所有元素异或之后结果为x,因为a!=b,所以x=a^b,且x ...
8 -- 深入使用Spring -- 5...1 启用Spring缓存
8.5.1 启用Spring缓存 Spring配置文件专门为缓存提供了一个cache:命名空间,为了启用Spring缓存,需要在配置文件中导入cache:命名空间. 导入cache:命名空间之后,启用 ...
Diffuse Shading——漫反射光照改善技巧
转:http://www.narkii.com/club/thread-355113-1.html 我们会列出两种方法:使用Half Lambert lighting model(半兰伯特光照模型)和 ...
Hadoop2.7.3+HBase1.2.5+ZooKeeper3.4.6搭建分布式集群环境
Hadoop2.7.3+HBase1.2.5+ZooKeeper3.4.6搭建分布式集群环境一.环境说明个人理解:zookeeper可以独立搭建集群,hbase本身不能独立搭建集群需要和hadoo ...
Ubuntu下SSH无密码验证配置
前言 SSH为Secure Shell 的缩写,是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议.越来越多的小伙伴们使用远程登录,而ssh安全性无疑是很高的,那么我们现在来看看如何实现ss ...
Redis 下载与安装(Windows版)
下载 1.Github下载地址:https://github.com/MicrosoftArchive/redis/releases 2.百度网盘下载地址:Redis-x64-3.2.100.zip ...
Spring学习笔记--Spring配置文件和依赖注入
Spring配置文件 1.alias:设置别名,为bean设置别名,并且可以设置多个别名;  <alias name="user" al ...

python解析VOC的xml文件并转成自己需要的txt格式

python解析VOC的xml文件并转成自己需要的txt格式的更多相关文章

随机推荐

热门专题