Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）

xml实例：

版本一：

<?xml version="1.0" encoding="UTF-8"?><country name="chain"><provinces><heilongjiang name="citys"><haerbin/><daqing/></heilongjiang><guangdong name="citys"><guangzhou/><shenzhen/><huhai/></guangdong><taiwan name="citys"><taibei/><gaoxiong/></taiwan><xinjiang name="citys"><wulumuqi waith="tianqi">晴</wulumuqi></xinjiang></provinces></country>

没有空格，换行，的版本

python操作操作实例：

from lxml import etree

class r_xpath_xml(object):

    def __init__(self):

        self.xmetrpa=etree.parse('info.xml') #读取xml数据

        pass

    def xpxm(self):

        xpxlm=self.xmetrpa

        print etree.tostring(xpxlm) #打印xml数据

        root=xpxlm.getroot() #获得该树的树根

        print root.tag,' ',  #打印根标签名

        print root.items() #获得标签属性名称和属性值

        for a in root:  ##遍历根下一集级标签

            print a.tag,a.items(),a.text,' 被打印的类型为： ',type(a)  #打印标签名称，标签属性，标签数据

        for b in a:

            print b.tag,b.items(),b.text#,b

            for c in b:

                print c.tag,c.items(),c.text#,c

        for d in c:

            print d.tag,d.items(),d.test,d

        print xpxlm.xpath('//node()')#.items()#.tag

        print '====================================================================================================='

        xa=xpxlm.xpath('//heilongjiang/*')

        print xa

        for xb in xa:

            print xb.tag,xb.items(),xb.text

        xc=xpxlm.xpath('//xinjiang/*')

        print xc

        for xd in xc:

            print xd.tag,xd.items(),xd.text

if __name__ == '__main__':

    xpx=r_xpath_xml()

    xpx.xpxm()

应用for循环遍历标签层次结构，tag获取标签名，items()通过字典函数获取[（'属性名' , '属性值'）]，text获取标签对之间的数据。tag，items(),text针对的类型为：<type 'lxml.etree._Element'>
打印结果：

<country name="chain"><provinces><heilongjiang name="citys"><haerbin/><daqing/></heilongjiang><guangdong name="citys"><guangzhou/><shenzhen/><huhai/></guangdong><taiwan name="citys"><taibei/><gaoxiong/></taiwan><xinjiang name="citys"><wulumuqi waith="tianqi">晴</wulumuqi></xinjiang></provinces></country>

country   [('name', 'chain')]

provinces [] None  被打印的类型为：  <type 'lxml.etree._Element'>

heilongjiang [('name', 'citys')] None

haerbin [] None

daqing [] None

guangdong [('name', 'citys')] None

guangzhou [] None

shenzhen [] None

huhai [] None

taiwan [('name', 'citys')] None

taibei [] None

gaoxiong [] None

xinjiang [('name', 'citys')] None

wulumuqi [('waith', 'tianqi')] 晴

[<Element country at 0x2d47b20>, <Element provinces at 0x2d47990>, <Element heilongjiang at 0x2d479b8>, <Element haerbin at 0x2d47558>, <Element daqing at 0x2d47328>, <Element guangdong at 0x2d47300>, <Element guangzhou at 0x2d476e8>, <Element shenzhen at 0x2d47530>, <Element huhai at 0x2d472d8>, <Element taiwan at 0x2d47260>, <Element taibei at 0x2d47238>, <Element gaoxiong at 0x2d47080>, <Element xinjiang at 0x2d47710>, <Element wulumuqi at 0x2d47968>, u'\u6674']

=====================================================================================================

[<Element haerbin at 0x2d479b8>, <Element daqing at 0x2d47148>]

haerbin [] None

daqing [] None

[<Element wulumuqi at 0x2d47968>] 类型为： <type 'list'>

wulumuqi [('waith', 'tianqi')] 晴

xml实例：

版本二：

<?xml version="1.0" encoding="UTF-8"?>

<country name="chain">

    <provinces>

        <city:table xmlns:city="http://www.w3school.com.cn/furniture">

        <heilongjiang name="citys"><city:haerbin/><city:daqing/></heilongjiang>

        <guangdong name="citys"><city:guangzhou/><city:shenzhen/><city:zhuhai/></guangdong>

        <taiwan name="citys"><city:taibei/><city:gaoxiong/></taiwan>

        <xinjiang name="citys"><city:wulumuqi>晴</city:wulumuqi></xinjiang>

        </city:table>

    </provinces>

</country>

实例：

print xpxlm.xpath('//node()')

打印结果：
空格回车字符，命名空间。

[<Element country at 0x2e79b20>, '\n    ', <Element provinces at 0x2e79990>, '\n        ', <Element {http://www.w3school.com.cn/furniture}table at 0x2e79710>, '\n        ', <Element heilongjiang at 0x2e799b8>, <Element {http://www.w3school.com.cn/furniture}haerbin at 0x2e79328>, <Element {http://www.w3school.com.cn/furniture}daqing at 0x2e79968>, '\n        ', <Element guangdong at 0x2e79530>, <Element {http://www.w3school.com.cn/furniture}guangzhou at 0x2e79300>, <Element {http://www.w3school.com.cn/furniture}shenzhen at 0x2e792d8>, <Element {http://www.w3school.com.cn/furniture}zhuhai at 0x2e79260>, '\n        ', <Element taiwan at 0x2e79238>, <Element {http://www.w3school.com.cn/furniture}taibei at 0x2e79080>, <Element {http://www.w3school.com.cn/furniture}gaoxiong at 0x2e79058>, '\n        ', <Element xinjiang at 0x2e796e8>, <Element {http://www.w3school.com.cn/furniture}wulumuqi at 0x2e79558>, u'\u6674', '\n        ', '    \n    ', '\n']

去掉空格：

        xp=xpxlm.xpath('//node()')

        print xp,           #.items()#.tag

        for i in xp:

            if '' in i or '\n' in i:

                continue

            else:

                print i.tag

通过判断去除空格换行符号

输出结果：

provinces

{city}table

heilongjiang

{city}haerbin

{city}daqing

guangdong

{city}guangzhou

{city}shenzhen

{city}zhuhai

taiwan

{city}taibei

{city}gaoxiong

xinjiang

{city}wulumuqi

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）的更多相关文章

python通过LXML库读取xml命名空间
xml实例版本: <a> <city:table xmlns:city="city"> <heilongjiang name="citys& ...
js遍历对象所有的属性名称和值
/* * 用来遍历指定对象所有的属性名称和值 * obj 需要遍历的对象 * author: Jet Mah * website: http://www.javatang.com/archives/2 ...
遍历JavaScript某个对象所有的属性名称和值
/* * 用来遍历指定对象所有的属性名称和值 * obj 需要遍历的对象 */ function allPrpos(obj) { // 用来保存所有的属性名称和值 var props = " ...
python lxml库生成xml文件-节点命名空间问题
lxml库,处理xml很强大,官方文档:https://lxml.de/tutorial.html#namespaces 例如: 我们要生成如下格式的报文: <ttt:jesson xmlns: ...
C#使用Linq to XML进行XPath查询
最近在用到HtmlAgliltyPack进行结点查询时,发现这里选择结点使用的是XPath.所以这里总结一下在C#中使用XPath查询XML的方法.习惯了用Linq,这里也是用的Linq to xml ...
【xml】python的lxml库使用
1.官方教程:http://lxml.de/tutorial.html#parsing-from-strings-and-files 最重要的文档,看完基本就能用了 2.lxml支持xpath,xp ...
Python 使用PyMySql 库连接MySql数据库时查询中文遇到的乱码问题（实测可行） python 连接 MySql 中文乱码 pymysql库
最近所写的代码中需要用到python去连接MySql数据库,因为是用PyQt5来构建的GUI,原本打算使用PyQt5中的数据库连接方法,后来虽然能够正确连接上发现还是不能提交修改内容,最后在qq交流群 ...
Python中使用面状矢量裁剪栅格影像，并依据Value值更改矢量属性
本文整体思路:在Python中使用Geopandas库,依次读取shp文件的每一个面状要素,获取其空间边界信息并裁剪对应的栅格影像,计算所裁剪影像Value值的众数,将其设置为对应面状要素的NewTY ...
Python 爬虫解析库的使用 --- XPath
一.使用XPath XPath ,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言.它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索. 所 ...

随机推荐

Docker学习-安装，配置，运行
Docker继续学习 2019年12月15日23:15:36 第二次学习docker Docker三个重要概念: 镜像就是一个模板(类似一个Java类) 容器容器是用镜像创建的运行实例. 仓库仓 ...
SpringBoot系列教程web篇之Beetl环境搭建
前面两篇分别介绍了目前流行的模板引擎Freemaker和Thymeleaf构建web应用的方式,接下来我们看一下号称性能最好的国产模板引擎Beetl,如何搭建web环境本文主要来自官方文档,如有疑问 ...
MySQL面试题看这一篇就够了
现在mysql相关的面试,面试官总会问一些相关的技术问题.在这里,因此就总结一些常见的mysql面试题,都是自己平时工作的总结以及经验.希望大家看完,能避开”面试坑”. 1.MySQL主从复制的原理. ...
微信小程序之自定义导航栏（可实现动态添加）以及swiper（swiper-item）实现自动切换，导航标题也跟着切换
<view class="movie-container">  <view > <scroll-view scro ...
Python基础学习：字符串认知与应用
一.len() 家电维修 len:全写是length,是计算容量的函数:例如a="1234",len(a)=4 如果是中文字符,比如a="哈",len(a)= ...
Crazy Binary String（前缀和）（2019牛客暑期多校训练营（第三场））
示例: 输入: 801001001 输出:4 6 题意:一段长度为n且只有 ‘0’ 和 ‘1’ 的字符串,求子串中 ‘0’ 和 ‘1’ 数目相等和子序列中 ‘0’ 和 ‘1’ 数目相等的最大长度. 思 ...
MongoDB初始化创建管理员账户登录
1.查看mongodb服务是否开启: ps -ef | grep mongod 2.管理员角色必须在启用--auth认证参数之前创建,否则会没有操作权限.如果之前已经创建过用户,请先删除. kill掉 ...
LOJ2482 CEOI2017 Mousetrap 二分答案、树形DP
传送门表示想不到二分答案qwq 将树看作以陷阱为根.先考虑陷阱和起始点相邻的情况,此时老鼠一定会往下走,而如果管理者此时不做操作,那么一定会选择让操作次数变得最大的一棵子树.设\(f_i\)表示当前 ...
React 了解学习
1.nodejs安装程序https://nodejs.org/en/download/ create-react-app 类似 vs2017开发工具,集成了webpack 打包发布,loader和默认 ...
使用jQuery开发tab选项卡插件（可以右键关闭多个标签）
在前一篇“使用jQuery开发tab选项卡插件”的基础上添加了tab标签右键关闭菜单功能,菜单主要包括:关闭当前标签.关闭左侧标签.关闭右侧标签.关闭其他.关闭全部. 一.插件效果二.实现思路为w ...

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）的更多相关文章

随机推荐

热门专题