python机器可读数据-XML

XML

XML是一门标记语言。也就是说，它具有包含格式化数据的文档结构。

XML文档本质上只是格式特殊的数据文件。

在XML文件中有两个位置可以保存数据值：2个标签之间，标签的属性。

导入XML数据

import xml.etree.ElementTree as ET

tree = ET.parse('data-text.xml')  #把整个XML对象保存在变量tree中

root = tree.getroot()             #getroot函数获得树的根元素

print(list(root))                 #变量root的所有方法和属性

这样就获得了data-text.xml 文件的根元素root，并把root变为列表形式。

得到：

[<Element 'QueryParameter' at 0x000000000D864908>, <Element 'QueryParameter' at 0x000000000D864A48>, <Element 'QueryParameter' at 0x000000000D864A98>, <Element 'QueryParameter' at 0x000000000D864AE8>, <Element 'QueryParameter' at 0x000000000D864B38>, <Element 'QueryParameter' at 0x000000000D864B88>, <Element 'Copyright' at 0x000000000D864BD8>, <Element 'Disclaimer' at 0x000000000D864CC8>, <Element 'Metadata' at 0x000000000D864D68>, <Element 'Data' at 0x000000000FCC9D68>]

其中Element后面引号中为根元素root的子元素。某些元素具有子元素（不是所有）。可以用find或findall利用标签搜索子元素。

import xml.etree.ElementTree as ET

tree = ET.parse('data-text.xml')  #把整个XML对象保存在变量tree中

root = tree.getroot()             #getroot函数获得树的根元素

data = root.find('Data')

print(data)

得到子元素data

<Element 'Data' at 0x000000000DA29A48>

得到列表形式data

print(list(data))

[<Element 'Observation' at 0x000000000DA29A98>, <Element 'Observation' at 0x000000000DA29DB8>, <Element 'Observation' at 0x000000000DA24138>, <Element 'Observation' at 0x000000000DA24458>, <Element 'Observation' at 0x000000000DA24778>, <Element 'Observation' at 0x000000000DA24A98>, <Element 'Observation' at 0x000000000DA24DB8>, <Element 'Observation' at 0x000000000DA1ED68>, <Element 'Observation' at 0x000000000DA1EC78>, <Element 'Observation' at 0x000000000DA1E958>, <Element 'Observation' at 0x000000000DA1E408>, <Element 'Observation' at 0x000000000DA1E368>, <Element 'Observation' at 0x000000000DA1BEA8>, <Element 'Observation' at 0x000000000DA1BC28> ]

Observation为data的子元素
事实上可以这样：

import xml.etree.ElementTree as ET

tree = ET.parse('data-text.xml')  #把整个XML对象保存在变量tree中

root = tree.getroot()             #getroot函数获得树的根元素

data = root.find('Data')

for i in data:                   #data中每一个元素i

    for ii in i:                #每一个元素i中的每一个元素ii

        print(ii.attrib)        #字典形式ii

        print(ii.text)          #2个标签之间的文本，没有则None

Kazil J, Jarmul K. Data Wrangling with Python[J]. 2016.

python机器可读数据-XML的更多相关文章

用 ElementTree 在 Python 中解析 XML
用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...
python标准库xml.etree.ElementTree的bug
使用python生成或者解析xml的方法用的最多的可能就数python标准库xml.etree.ElementTree和lxml了,在某些环境下使用xml.etree.ElementTree更方便一些 ...
在python中处理XML
XML是实现不同语言或程序之间进行数据交换的协议,XML文件格式如下: <data> <country name="Liechtenstein"> < ...
[python标准库]XML模块
1.什么是XML XML是可扩展标记语言(Extensible Markup Language)的缩写,其中的标记(markup)是关键部分.您可以创建内容,然后使用限定标记标记它,从而使每个单词. ...
python专题-读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
python模块：xml
"""Core XML support for Python. This package contains four sub-packages: dom -- The W ...
【304】python专题-读取xml文件
参考:XML DOM 参考手册(w3school) 参考:python专题-读取xml文件参考:请问用python怎么修改xml的节点值? 1. 读取标签内的文本(Python) 如下的 xml 文 ...
Python模块 shelve xml configparser hashlib
常用模块1. shelve 一个字典对象模块自动序列化2.xml 是一个文件格式写配置文件或数据交换 <a name="hades">123</a>3. ...
python模块(shelve,xml,configparser,hashlib,logging)
1.1shelve模块 shelve 模块比pickle模块简单,只有一个open函数,返回类似字典对象,可读可写:key必须为字符串, 而值可以是python所支持的数据类型. shelve模块主要 ...

随机推荐

selenium 文件上传
一般分两个场景:一种是input标签,这种可以用selenium提供的send_keys()方法轻松解决: 另外一种非input标签实现起来比较困难,可以借助autoit工具或者SendKeys第三方 ...
list set map区别及适用场景
list与Set.Map区别及适用场景 1.List,Set都是继承自Collection接口,Map则不是 2.List特点:元素有放入顺序,元素可重复 ,Set特点:元素无放入顺序,元素不可重 ...
mongodb修改和删除操作
修改数据修改里面还有查询条件.你要该谁,要告诉 mongo.查找名字叫做小明的,把年龄更改为 16 岁:1 db.student.update({"name":"小明&q ...
移动质量（MQ）测试系列
移动质量(MQ)测试向移动开发者提供专业.稳定.全面.高价值的自动化测试平台. 发现 APP 中的各类隐患,包括 APP 崩溃.各类兼容性.功能性.性能问题等等. MQ 的 5 大功能(兼容性测试. ...
排查OPENSTACK浮动IP被占用记录
在openstack上新建机器时,发现用户无法登陆. 检查该机器的22端口,返回 Connection refused. ping该IP,发现可以ping通. 释放该浮动ip,然后去ping该 ...
acm：屁屁上的巴掌
涉及算法:深度搜索题目: 题目描述小新是个调皮的孩子,他总是会把衣服搞脏,他的妈妈美伢非常的生气,于是在<和妈妈的约定条款>加上了第三百七十七条:小新衣服上每有一块污渍妈妈就会打小新的 ...
Ubuntu 18.04.1安装Nginx
一.安装Nginx所需的环境 Ubuntu可以通过apt源安装以下依赖库,CentOS可以通过yum安装 1.Nginx是C语言开发,需要gcc依赖库先检查本机是否有gcc环境 gcc -v 如果没 ...
[原][杂谈]如果人类的末日："天网"出现
本文由南水之源在2019年3月21日发布,转载需声明原作者本文仅为一次基于科技发展与科幻小说的幻想,如果天网真的出现,请不要参考这篇逻辑破败的推论. 参考: 天网(Skynet),是电影<终结 ...
webpack学习笔记 (一)
一.安装nodejs: 点击打开nodejs官方站点: 点击下图框住的按钮,下周nodejs安装包: 安装下载好的安装包. 安装完毕之后,在cmd中输入node -v查看是否已经安装成功如果有版本 ...
python3学习笔记
之前一直使用python2.7,最近打算学习下python3教程,再此记录下一些要点(未完待续...) 1.缩进缩进有利有弊.好处是强迫你写出格式化的代码,但没有规定缩进是几个空格还是Tab.按照约 ...

python机器可读数据-XML

XML

导入XML数据

python机器可读数据-XML的更多相关文章

随机推荐

热门专题