【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签，遍历各标签的数据

xml文档:

<GetMatchingProductResult ASIN="B071LF9R6G" status="Success">...</GetMatchingProductResult>

<GetMatchingProductResult ASIN="B0714BP3H4" status="Success">...</GetMatchingProductResult>

<GetMatchingProductResult ASIN="B0756FL8R7" status="Success">...</GetMatchingProductResult>

<ResponseMetadata>

# 使用minidom解析器打开XML文档

DOMTree = xml.dom.minidom.parse("./test.xml")

collection = DOMTree.documentElement

# collection是针对整个文件的文档,GetMatchingProductResults 获取的是三个名字相同的标签,不同标签的数据对象

GetMatchingProductResults = collection.getElementsByTagName('GetMatchingProductResult')

# GetMatching 是针对每个标签对象GetMatching作为xml对象进行对应取值

for GetMatching in GetMatchingProductResults:

    asin = GetMatching.getElementsByTagName('ASIN')[0].childNodes[0].data

    print(asin)

【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签，遍历各标签的数据的更多相关文章

【python小随笔】将一个列表的值，分成10个一组，遍历的时候每10个遍历一次
t = ['B071LF9R6G', 'B0714BP3H4', 'B0756FL8R7', 'B072HX95ZR', 'B07CX389LX', 'B07D9MZ7BD', 'B07D9L15L5 ...
写论文，没数据？R语言抓取网页大数据
写论文,没数据?R语言抓取网页大数据纵观国内外,大数据的市场发展迅猛,政府的扶持也达到了空前的力度,甚至将大数据纳入发展战略.如此形势为社会各界提供了很多机遇和挑战,而我们作为卫生(医学)统计领域的 ...
python开发_xml.dom_解析XML文档_完整版_博主推荐
在阅读之前,你需要了解一些xml.dom的一些理论知识,在这里你可以对xml.dom有一定的了解,如果你阅读完之后. 下面是我做的demo 运行效果: 解析的XML文件位置:c:\\test\\hon ...
Python中使用ElementTree解析xml
在Python中,ElementTree是我们常用的一个解析XML的模块 1.导入ElementTree模块 from xml.etree import ElementTree as ET 2.初始化 ...
python抓取百度百科点赞数等动态数据
利用selenium 模拟浏览器打开页面,加载后抓取数据 #!/usr/bin/env python # coding=utf-8 import urllib2 import re from bs4 ...
[Python爬虫] 之十六：Selenium +phantomjs 利用 pyquery抓取一点咨询数据
本篇主要是利用 pyquery来定位抓取数据,而不用xpath,通过和xpath比较,pyquery效率要高. 主要代码: # coding=utf-8 import os import re fro ...
[Python爬虫] 之二十三：Selenium +phantomjs 利用 pyquery抓取智能电视网数据
一.介绍本例子用Selenium +phantomjs爬取智能电视网(http://news.znds.com/article/news/)的资讯信息,输入给定关键字抓取资讯信息. 给定关键字:数字 ...
[Python爬虫] 之二十一：Selenium +phantomjs 利用 pyquery抓取36氪网站数据
一.介绍本例子用Selenium +phantomjs爬取36氪网站(http://36kr.com/search/articles/电视?page=1)的资讯信息,输入给定关键字抓取资讯信息. 给 ...
[Python爬虫] 之十九：Selenium +phantomjs 利用 pyquery抓取超级TV网数据
一.介绍本例子用Selenium +phantomjs爬取超级TV(http://www.chaojitv.com/news/index.html)的资讯信息,输入给定关键字抓取资讯信息. 给定关键 ...

随机推荐

弹性FLEX布局
页面布局一直都是web应用样式设计的重点我们传统的布局方式都是基于盒模型的利用display.position.float来布局有一定局限性比如说实现自适应垂直居中随着响应式布局的流行,CSS ...
hdu 1548 A strange lift（迪杰斯特拉，邻接表）
A strange lift Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)To ...
call，apply，bind详解
为什么要改变this指向? 我们知道bind,call,apply的作用都是用来改变this指向的,那为什么要改变this指向呢?请看下面的例子: var name="lucy"; ...
[转]什么是CNN、RNN、LSTM
. 全连层每个神经元输入: 每个神经元输出: (通过一个激活函数) 2. RNN(Recurrent Neural Network) 与传统的神经网络不通,RNN与时间有关. 3. LSTM(Lon ...
4-2 setting中一定要将ROBOTSTXT_OBEY = False的注释去掉
# Obey robots.txt rules##默认遵循robots协议的,默认去读取每个网站上的robots协议ROBOTSTXT_OBEY = False
linux中添加常用应用程序的桌面图标
在网上随处可以找到怎么样把应用程序的图标放到桌面上,我刚用ubuntu时也是按照网上的做法,一步一步的做的,现将网上的做法复制下来: 桌面配置文件简述\label{sec:desktop file} ...
H3C RIP协议概述
ZOJ 1276 "Optimal Array Multiplication Sequence"（最优矩阵链乘问题+区间DP）
传送门 •题意矩阵 A(n×m) 和矩阵 B(m×k) 相乘,共做 n×m×k 次乘法运算: 给你 n 个矩阵,求这 n 个矩阵的最优结合方式,使得做的总乘法运算次数最少: •题解定义dp(i,j ...
The Function() Constructor
Functions are usually defined using the function keyword, either in the form of a function definitio ...
int64 DWORD 与cstring 互转
//int64 与cstring 互转 int64_t val = 1111111111111111111; CString str; str.Format(("%I64d"), ...

【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签，遍历各标签的数据

【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签，遍历各标签的数据的更多相关文章

随机推荐

热门专题