day5模块学习--XML模块
XML文件处理
XML文件处理,有好几种方式,这里介绍一下xml.etree.ElementTree as ET。
注意:xml.etree.ElementTree模块在应对恶意结构数据时显得并不安全。
每个element对象都具有以下属性:
1. tag:string对象,表示数据代表的种类;
2. attrib:dictionary对象,表示附有的属性;
3. text:string对象,表示element的内容;
4. tail:string对象,表示element闭合之后的尾迹;
5. 若干子元素(child elements)。
<tag attrib1=1>text</tab>tail
1 2 3 4
创建元素的方法有Element或者SubElement(),前者称作元素的构建函数(constructor),用以构建任一独存的元素;后者称作元素的制造函数(factory function),用以制造某一元素的子元素。
有了一串元素之后,使用ElementTree类来将其打包,把一串元素转换为xml文件或者XML文件中解析出来。
若想加快速度,可以使用C语言编译的API xml.etree.cElementTree。
在使用xml.etree.ElementTree时,一般都按如下导入:
try:
        import xml.etree.ElementTree as ET
  except ImportError:
        import xml.etree.cElementTree as ET
XML是中结构化数据形式,在ET中使用ElementTree代表整个XML文档,并视其为一棵树,Element代表这个文档树中的单个节点。
ET对象具有多种方法从不同来源导入数据,如下:
#从硬盘的xml文件读取数据
try:
import xml.etree.ElementTree as ET
except ImportError:
import xml.etree.cElementTree as ET tree = ET.parse("XML文件") #载入数据
root = tree.getroot()
print(root)
print(root.tag) #获取根节点
#遍历xml文档
try:
import xml.etree.ElementTree as ET
except ImportError:
import xml.etree.cElementTree as ET tree = ET.parse("XML文件") #载入数据
root = tree.getroot()
for child in root: #遍历节点
print(child.tag,child.attrib)
输出如下:
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
#只遍历year 节点
try:
import xml.etree.ElementTree as ET
except ImportError:
import xml.etree.cElementTree as ET tree = ET.parse("XML文件") #载入数据
root = tree.getroot()
for node in root.iter("year"):
print(node.tag,node.text)
输出如下:
year 2008
year 2011
year 201
修改和删除xml文档内容
try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET tree = ET.parse("XML文件") #载入数据
root = tree.getroot()
#修改
for node in root.iter("year"):
new_year = int(node.text) + #node.text()值,属性的值
node.text = str(new_year)
node.set("update","yes") tree.write("XML文件") #修改文件之后,重新写入文件里面,不然修改文件是无效的 #删除node
for country in root.findall("country"):
rank = int(country.find("rank").text)
if rank > :
root.remove(country) tree.write("output.xml")
文件操作中,每次修改完成数据之后,要重新写会文件之中,不然修改文件是没有用的。要重新写会文件才有效果。
Element中的遍历与查询
Element.iter(tag=None):遍历该Element所有后代,也可以指定tag进行遍历寻找。
try:
        import xml.etree.ElementTree as ET
  except ImportError:
        import xml.etree.cElementTree as ET
  tree = ET.parse("XML文件")     #载入数据
  root = tree.getroot()
  for node in root.iter():
        print(node)
Element.findall(path):查找当前元素下tag或path能够匹配的直系节点。
Element.find(path):查找当前元素下tag或path能够匹配的首个直系节点。
Element.text: 获取当前元素的text值。
Element.get(key, default=None):获取元素指定key对应的属性值,如果没有该属性,则返回default值。
ElementTree对象
class xml.etree.ElementTree.ElementTree(element=None, file=None)
element如果给定,则为新的ElementTree的根节点。 _setroot(element):用给定的element替换当前的根节点。慎用。
# 以下方法与Element类中同名方法近似,区别在于它们指定以根节点作为操作对象。
find(match)
findall(match)
findtext(match, default=None)
getroot():获取根节点.
iter(tag=None)
iterfind(match)
parse(source, parser=None):装载xml对象,source可以为文件名或文件类型对象.
write(file, encoding="us-ascii", xml_declaration=None, default_namespace=None,method="xml")
自己创建xml文档
import xml.etree.ElementTree as ET       
new_xml = ET.Element("namelist")                                     #根节点namelist
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})       #SubElement()子节点,new_xml的子节点
age = ET.SubElement(name,"age",attrib={"checked":"no"})              #创建子节点,name下的age节点
sex = ET.SubElement(name,"sex")
age.text = ''                                                      #写入值,age赋值
name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"})
age = ET.SubElement(name2,"age")
age.text = ''
et = ET.ElementTree(new_xml) #生成文档对象
et.write("test.xml", encoding="utf-8",xml_declaration=True)
ET.dump(new_xml) #打印生成的格式 
day5模块学习--XML模块的更多相关文章
- python常用模块之xml模块
		
python常用模块之xml模块 xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,在json还没诞生的年代,大家都是使用xml,目前很多传统公司的系 ...
 - day5模块学习 -- os模块学习
		
python基础之模块之os模块 os模块 os模块的作用: os,语义为操作系统,所以肯定就是操作系统相关的功能了,可以处理文件和目录这些我们日常手动需要做的操作,就比如说:显示当前目录下所有文件/ ...
 - python-Day5-深入正则表达式--冒泡排序-时间复杂度 --常用模块学习:自定义模块--random模块:随机验证码--time & datetime模块
		
正则表达式 语法: mport re #导入模块名 p = re.compile("^[0-9]") #生成要匹配的正则对象 , ^代表从开头匹配,[0 ...
 - python全栈开发-hashlib模块(数据加密)、suprocess模块、xml模块
		
一.hashlib模块 1.什么叫hash:hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法 ...
 - python16_day06【类、RE模块、subprocess模块、xml模块、shelve模块】
		
一.shelve模块 import shelve # 基于pickle模块, d = shelve.open('shelve_test') class Test(object): def __init ...
 - python 之  random 模块、 shutil 模块、shelve模块、 xml模块
		
6.12 random 模块 print(random.random()) (0,1)----float 大于0且小于1之间的小数 print(random.randint(1,3)) [1,3] 大 ...
 - logging模块、shutil模块、subprocess模块、xml模块
		
logging模块 shutil模块 subprocess模块 xml模块 logging模块 函数式简单配置 import logging logging.debug('debug message' ...
 - day5模块学习--hashlib模块
		
hashlib模块 Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等. 什么是摘要算法呢?摘要算法又称哈希算法.散列算法.它通过一个函数,把任意长度的数据转换为一个长度 ...
 - day5模块学习--configparser模块
		
使用ConfigParser模块读写ini文件(http://blog.csdn.net/linda1000/article/details/11729561) ConfigParserPyth ...
 
随机推荐
- Jenkins maven 构建乱码,修改file.encoding系统变量编码为UTF-8
			
一切都是windows的控制台默认编码GBK问题 情景: 使用jenkins构建,console 输出的中文乱码.代码编码格式是utf-8,因为Jenkins会默认读取当前系统的编码格式,导致构建日志 ...
 - Java入门系列(四)内部类
			
为什么需要内部类? 真正的原因是这样的,java中的内部类和接口加在一起,可以的解决常被C++程序员抱怨java中存在的一个问题没有多继承.实际上,C++的多继承设计起来很复杂,而java通过内部类加 ...
 - 有用的Javascript,长期更新...
			
1,点击目标区域以外隐藏,运用场景:点击遮罩层,弹层关闭. // 点击目标区域以外隐藏 $(document).on("click", function (event) { var ...
 - java  创建最大堆
			
最大堆的性质是除了根节点之外的所有节点(i)都需要满足A[PARENT(i)]>A[i],即其对应节点值小于其父节点对应值. 下面实现以数组int []a构建最大堆. public class ...
 - sqlmap tamper脚本
			
本文来自:SQLmap tamper脚本注释, 更新了一些脚本,<<不断更新中>> 目前已经总共有50+的脚本,故对源文章进行更新... sqlmap-master ls -l ...
 - spring断言使用
			
断言就是断定某一个实际的值为自己预期想得到的,如果不一样就抛出异常. Assert经常用于: 1.判断method的参数是否属于正常值.2.juit中使用. import org.springfram ...
 - JVM性能调优监控工具详解
			
现实企业级Java开发中,有时候我们会碰到下面这些问题: OutOfMemoryError,内存不足 内存泄露 线程死锁 锁争用(Lock Contention) Java进程消耗CPU过高 .... ...
 - 状压dp+floyed(C - Hie with the Pie POJ - 3311 )
			
题目链接:https://cn.vjudge.net/contest/276236#problem/C 题目大意: 给你一个有n+1(1<=n<=10)个点的有向完全图,用矩阵的形式给出任 ...
 - 在Linode VPS上搭建离线下载神器Aria2+WEBUI管理及对国内云盘看法
			
在Linode VPS上搭建离线下载神器Aria2+WEBUI管理及对国内云盘看法 2015-09-21 by Hansen 原文链接:http://www.hansendong.me/archive ...
 - 关于new Handler()与new Handler(Looper.getMainLooper())区别
			
如果你不带参数的实例化:Handler handler=new Handler();那么这个会默认用当前线程的Looper对象. 一般而言,如果你的Handler是要用来刷新UI的,那么就需要在主线程 ...