python解析xml实例

如下，一个银行卡打标签后导出的数据

<?xml version="1.0" encoding="ISO-8859-1"?>

<annotation>

<filename>a001.jpg</filename>

<folder>users/three33//card</folder>

<source>

<submittedBy>three</submittedBy>

</source>

<imagesize>

<nrows>2240</nrows>

<ncols>3968</ncols>

</imagesize>

<object>

<name>numbers</name>

<deleted>0</deleted>

<verified>0</verified>

<occluded>no</occluded>

<attributes>6228480808055442079</attributes>

<parts>

<hasparts/>

<ispartof/>

</parts>

<date>12-May-2019 06:21:39</date>

<id>0</id>

<type>bounding_box</type>

<polygon>

<username>anonymous</username>

<pt>

<x>927</x>

<y>1278</y>

</pt>

<pt>

<x>3269</x>

<y>1278</y>

</pt>

<pt>

<x>3269</x>

<y>1475</y>

</pt>

<pt>

<x>927</x>

<y>1475</y>

</pt>

</polygon>

</object>

</annotation>

（上面的代码无法保留格式，还是截张图吧

现要将其中的标记的四个坐标和银行卡号读取出来，并保存到文本文件。由于有几百张图片，需要批处理。

代码：

 import os

 import sys

 import xml.etree.cElementTree as ET

 from_path = "./card"     //输入文件夹

 to_path = "./cardout"    //输出文件夹

 files = os.listdir(from_path)

 files.sort()      #按字典序排序

 i = 1

 for filename in files:

     dir1 = os.path.join(from_path, filename)

     tree = ET.ElementTree(file=dir1)

     root = tree.getroot()

     new_filename = filename[:-4] + ".txt"

     dir2 = os.path.join(to_path,new_filename)

     fobj = open(dir2,'w+')

     print("time: %d, from_filename: %s, to_filename: %s" % (i, dir1, dir2))

     for elem in tree.iterfind('object/polygon/pt'):

         fobj.write((elem[0].text + ',' + elem[1].text + ','))

         #print(elem[0].text + ',' + elem[1].text + ',')

     for elem in tree.iterfind('object/attributes'):

         fobj.write(elem.text)

     fobj.close()

     i = i + 1

效果：

python解析xml实例的更多相关文章

Python 解析XML实例（xml.sax）
已知movies.xml <collection shelf="New Arrivals"> <movie title="Enemy Behind&qu ...
python 解析XML python模块xml.dom解析xml实例代码
分享下python中使用模块xml.dom解析xml文件的实例代码,学习下python解析xml文件的方法. 原文转自:http://www.jbxue.com/article/16587.html ...
python解析xml模块封装代码
在python中解析xml文件的模块用法,以及对模块封装的方法.原文转自:http://www.jbxue.com/article/16586.html 有如下的xml文件:<?xml vers ...
python解析xml之lxml
虽然python解析xml的库很多,但是,由于lxml在底层是用C语言实现的,所以lxml在速度上有明显优势.除了速度上的优势,lxml在使用方面,易用性也非常好.这里将以下面的xml数据为例,介绍l ...
python解析xml
python解析xml import xml.dom.minidom as minidom dom = minidom.parse("aa.xml") root = dom.get ...
python 解析xml
在工作中很多时候都要用到xml,使用这个时候难免会设计到解析他,然后就研究了一下python解析xml问题,看了很多东西,python有很多解析xml的包,但是也折腾我好一段时间,最后选择了这个方法. ...
Python 解析 XML 文件生成 HTML
XML文件result.xml,内容如下: <ccm> <metric> <complexity>1</complexity> <unit> ...
横向对比分析Python解析XML的四种方式
横向对比分析Python解析XML的四种方式在最初学习PYTHON的时候,只知道有DOM和SAX两种解析方法,但是其效率都不够理想,由于需要处理的文件数量太大,这两种方式耗时太高无法接受. 在网络搜 ...
python 解析xml 文件: SAX方式
环境 python:3.4.4 准备xml文件首先新建一个xml文件,countries.xml.内容是在python官网上看到的. <?xml version="1.0" ...

随机推荐

Django 中ORM 的使用
一:Django 中 orm 的使用 1:手动新建一个数据库 2 :告诉Django连接哪个数据库 settings.py里配置数据库连接信息: #数据库相关的配置项 DATABASES ={ 'de ...
ACM-ICPC2018徐州网络赛 BE, GE or NE（对抗搜索+博弈+记忆化）
BE, GE or NE 23.58% 1000ms 262144K In a world where ordinary people cannot reach, a boy named &quo ...
HDU - 6400 多校8 Parentheses Matrix（构造）
Parentheses Matrix Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Oth ...
HDU - 1869 六度分离 Floyd多源最短路
六度分离 1967年,美国著名的社会学家斯坦利·米尔格兰姆提出了一个名为“小世界现象(small world phenomenon)”的著名假说,大意是说,任何2个素不相识的人中间最多只隔着6个人,即 ...
MS SQL读取JSON数据
前面有一篇<在SQL中直接把查询结果转换为JSON数据>https://www.cnblogs.com/insus/p/10905566.html,是把table转换为json. 现反过来 ...
css border实现三角形
实现过程: 正常的border <div class="box"></div> .box { background: #ddd; width: 100px; ...
动画重定向技术分析和Unity中的应用
http://www.jianshu.com/p/6e9ba1b9c99e 因为一些手游项目需要使用Unity引擎,但在动画部分需要使用重定向技术来实现动画复用,考虑到有些项目开发人员没有过这方面的经 ...
loj #6079. 「2017 山东一轮集训 Day7」养猫【最大费用最大流】
首先假设全睡觉,然后用费用流考虑平衡要求建立网络流把1~n的点看作是i-k+1~k这一段的和,连接(i,i+k,1,e[i]-s[i]),表示把i改成吃饭,能对i~i+k-1这一段的点产生影响:然后 ...
洛谷P1582 倒水
P1582 倒水题目描述一天,CC买了N个容量可以认为是无限大的瓶子,开始时每个瓶子里有1升水.接着~~CC发现瓶子实在太多了,于是他决定保留不超过K个瓶子.每次他选择两个当前含水量相同的瓶子,把 ...
IT兄弟连 JavaWeb教程监听器1
1 基本概念监听器是一个专门用于对其他对象身上发生的事件或状态改变进行监听和相应处理的对象,当被监视的对象发生情况时,立即采取相应的行动.监听器其实就是一个实现特定接口的普通java程序,这个程序 ...

python解析xml实例

python解析xml实例的更多相关文章

随机推荐

热门专题