python 处理xml文件

需求在实际应用中，需要对xml配置文件进行实时修改，

1.增加、删除某些节点

2.增加，删除，修改某个节点下的某些属性

3.增加，删除，修改某些节点的文本

<annotation>

  <folder>qualified_rename</folder>

  <filename>15572943901</filename>

  <path>D:\Project\Lebal-Img\windows_v1.2\qualified_rename\15572943901.jpg</path>

  <source>

    <database>Unknown</database>

  </source>

  <size>

    <width>512</width>

    <height>384</height>

    <depth>3</depth>

  </size>

  <segmented>0</segmented>

  <object>

    <name>qualified</name>

    <pose>Unspecified</pose>

    <truncated>0</truncated>

    <difficult>0</difficult>

    <bndbox>

      <xmin>107</xmin>

      <ymin>109</ymin>

      <xmax>291</xmax>

      <ymax>267</ymax>

    </bndbox>

  </object>

</annotation>

实现思想
使用ElementTree，先将文件读入，解析成树，之后，根据路径，可以定位到树的每个节点，再对节点进行修改，最后直接将其输出

from xml.etree.ElementTree import ElementTree,Element

def read_xml(in_path):

  '''读取并解析xml文件

    in_path: xml路径

    return: ElementTree'''

  tree = ElementTree()

  tree.parse(in_path)

  return tree

def write_xml(tree, out_path):

  '''将xml文件写出

    tree: xml树

    out_path: 写出路径'''

  tree.write(out_path, encoding="utf-8",xml_declaration=True)

def if_match(node, kv_map):

  '''判断某个节点是否包含所有传入参数属性

    node: 节点

    kv_map: 属性及属性值组成的map'''

  for key in kv_map:

    if node.get(key) != kv_map.get(key):

      return False

  return True

#---------------search -----

def find_nodes(tree, path):

  '''查找某个路径匹配的所有节点

    tree: xml树

    path: 节点路径'''

  return tree.findall(path)

def get_node_by_keyvalue(nodelist, kv_map):

  '''根据属性及属性值定位符合的节点，返回节点

    nodelist: 节点列表

    kv_map: 匹配属性及属性值map'''

  result_nodes = []

  for node in nodelist:

    if if_match(node, kv_map):

      result_nodes.append(node)

  return result_nodes

#---------------change -----

def change_node_properties(nodelist, kv_map, is_delete=False):

  '''修改/增加 /删除 节点的属性及属性值

    nodelist: 节点列表

    kv_map:属性及属性值map'''

  for node in nodelist:

    for key in kv_map:

      if is_delete:

        if key in node.attrib:

          del node.attrib[key]

      else:

        node.set(key, kv_map.get(key))

def change_node_text(nodelist, text, is_add=False, is_delete=False):

  '''改变/增加/删除一个节点的文本

    nodelist:节点列表

    text : 更新后的文本'''

  for node in nodelist:

    if is_add:

      node.text += text

    elif is_delete:

      node.text = ""

    else:

      node.text = text

def create_node(tag, property_map, content):

  '''新造一个节点

    tag:节点标签

    property_map:属性及属性值map

    content: 节点闭合标签里的文本内容

    return 新节点'''

  element = Element(tag, property_map)

  element.text = content

  return element

def add_child_node(nodelist, element):

  '''给一个节点添加子节点

    nodelist: 节点列表

    element: 子节点'''

  for node in nodelist:

    node.append(element)

def del_node_by_tagkeyvalue(nodelist, tag, kv_map):

  '''同过属性及属性值定位一个节点，并删除之

    nodelist: 父节点列表

    tag:子节点标签

    kv_map: 属性及属性值列表'''

  for parent_node in nodelist:

    children = parent_node.getchildren()

    for child in children:

      if child.tag == tag and if_match(child, kv_map):

        parent_node.remove(child)

if __name__ == "__main__":

  #1. 读取xml文件

  tree = read_xml("./test.xml")

  #2. 属性修改

   #A. 找到父节点

  nodes = find_nodes(tree, "processers/processer")

   #B. 通过属性准确定位子节点

  result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"})

   #C. 修改节点属性

  change_node_properties(result_nodes, {"age": ""})

   #D. 删除节点属性

  change_node_properties(result_nodes, {"value":""}, True)

  #3. 节点修改

   #A.新建节点

  a = create_node("person", {"age":"","money":""}, "this is the firest content")

   #B.插入到父节点之下

  add_child_node(result_nodes, a)

  #4. 删除节点

    #定位父节点

  del_parent_nodes = find_nodes(tree, "processers/services/service")

    #准确定位子节点并删除之

  target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"})

  #5. 修改节点文本

    #定位节点

  text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"})

  change_node_text(text_nodes, "new text")

  #6. 输出到结果文件

  write_xml(tree, "./out.xml")

转自：https://www.cnblogs.com/soqu36/articles/9358298.html

　　https://blog.csdn.net/weixin_36279318/article/details/79176475

file_lists=os.listdir('q_xml')for file in file_lists:

        path='q_xml/%s'%file

        # path=r'D:\Project\yolo\yolov3-ppd_3class\Dataset\ppd\q_xml\15572943900.xml'

        #导入文件，创建树对象

        tree=read_xml(path)

        root=tree.getroot()

        new_name='Qualified'

        #找到所有‘object’节点

        for file_tag in root.findall('object'):

            #找到‘name’子节点

            file_name=file_tag.find('name')

            file_name.text=new_name

        tree.write('q_xml/%s'%file)

python 处理xml文件的更多相关文章

python读取xml文件报错ValueError: multi-byte encodings are not supported
1.在使用python对xml文件进行读取时,提示ValueError: multi-byte encodings are not supported 很多贴子上说把xml的编码格式改为,就可以正常执 ...
Python解析xml文件遇到的编码解析的问题
使用python对xml文件进行解析的时候,假设xml文件的头文件是utf-8格式的编码,那么解析是ok的,但假设是其它格式将会出现例如以下异常: xml.parsers.expat.ExpatErr ...
python读写xml文件
python读取xml文件 xml文件是具有树状结构的,如果想要访问某个叶子结点,必须逐层获取其父结点,要读取某个叶子结点内容用text成员使用前先加载xml工具包 try: import xml. ...
python操作xml文件
一.什么是xml? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. abc.xml <?xml version="1.0&q ...
Python 读写XML文件
Python 生成XML文件 from xml.dom import minidom # 生成XML文件方式 def generateXml(): impl = minidom.getDOMImple ...
python处理xml文件
参考:https://docs.python.org/2/library/xml.etree.elementtree.html 例子: <?xml version="1.0" ...
python 生成 xml文件属性的顺序问题
需求很奇葩. 文档示例 <ITEM key="username" eng="User Name" chn="用户名" val=&quo ...
python读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
python 解析xml 文件: Element Tree 方式
环境 python:3.4.4 准备xml文件首先新建一个xml文件,countries.xml.内容是在python官网上看到的. <?xml version="1.0" ...
python 解析xml 文件: DOM 方式
环境 python:3.4.4 准备xml文件首先新建一个xml文件,countries.xml.内容是在python官网上看到的. <?xml version="1.0" ...

随机推荐

oracle函数 TO_DATE(X[,c2[,c3]])
[功能]将字符串X转化为日期型 [参数]c2,c3,字符型,参照to_char() [返回]字符串如果x格式为日期型(date)格式时,则相同表达:date x 如果x格式为日期时间型(timest ...
mysql把一个表的字段update成另一个表的字段根据id
mysql把一个表的字段update成另一个表的字段根据id 1.填充activity表里面的creator字段,用org的founderid,其中activity的orgid要和org的id对应,具 ...
22-1 rbac权限设计
一表结构设计 from django.db import models # Create your models here. from django.db import models # Creat ...
oracle函数 COALESCE(c1, c2, ...,cn)
[功能]返回列表中第一个非空的表达式,如果所有表达式都为空值则返回1个空值 [参数]c1, c2, ...,cn,字符型/数值型/日期型,必须类型相同或null [返回]同参数类型 [说明]从Orac ...
jasperReports 通过java导出各种格式报表，及javaweb项目整合显示各种报表
注意:编写此项目时,请先手动编写**.jrxml 或者用IReport生成**.jrxml或**.jasper 注:java导出报表与web项目显示报表方法其实是相同的,只不过有一句代码不同,如下 ...
oracle WHERE子句中的连接顺序
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾. 例如: (低效,执行时间1 ...
behavior planning——15.cost function design weightTweaking
Designing cost functions is difficult and getting them all to cooperate to produce reasionable vehic ...
TAE words
love handle pang carbohydrate podiatry splay out Cinderella liposuction mingle fly t ...
原生_H5交互插件(适用于与V2.1)
这是js代码 /* * 适合版本为 2.1.0 * 前提是url上加 from=app */ var Native = {}; var ua = navigator.userAgent; var oU ...
php_sphinx安装使用
Sphinx的简介: Sphinx是一个独立的全文索引引擎,意图为其他应用提供高速.低空间占用.搜索结果高相关度的全文搜索功能.Sphinx可以非常容易的与 SQL数据库和脚本语言集成.内置MySQ ...

python 处理xml文件

python 处理xml文件的更多相关文章

随机推荐

热门专题