Xml解析之——Java/Android/Python
Xml解析之——Java/Android/Python
一、Xml文件 test.xml
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
<remote name="origin"
fetch="."
review="gerrit.huaqin.com:8081" />
<default revision="pythontest"
remote="origin"
sync-j="4" />
</note>
上面是一个简单的xml文件,个人的理解:xml文件是一个格式标准,代码清晰的树形结构体。
二、Xml文件的解析
xml解析主要是有SAX和DOM ,python还另外提供了ElementTree(轻量级的DOM),android提供了PULL。
简单的介绍下集中解析方式
DOM:将整个XML文件解析到内存生成一个树形结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
适用点:对象传输,全文件的数据修改等
SAX:基于事件驱动的,也就是说解析器去从xml文件的开始往下走,当发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
适用点:元素检索
PULL:运行方式和SAX类似,基于事件的模式。不同的是,在PULL解析过程中,我们需要自己获取产生的事件然后做相应的操作,而不像SAX那样由处理器触发一种事件的方法,执行我们的代码。PULL解析器小巧轻便,解析速度快,简单易用,非常适合在Android移动设备中使用,Android系统内部在解析各种XML时也是用PULL解析器。
三、例子
我们就以操作test.xml为例。
1.DOM(python实现)
__author__ = 'xuqiang'
from xml.dom import minidom,Node #先将文件解析出来放在DOMTree中
DOMTree = minidom.parse("test.xml")
#取根节点
note = DOMTree.documentElement
length = len(note.childNodes)
#依次取子节点
for child in note.childNodes:
if child.nodeType == Node.COMMENT_NODE:
print child.name + ':' + child.nodeValue
elif child.nodeType == Node.ELEMENT_NODE:
print "<%s>" % child.nodeName
#取子就子节点属性
if child.hasAttributes():
attributes = child.attributes
for index in range(attributes.length):
print " %s = %s" % (attributes.item(index).name,attributes.item(index).value)
#去子节点的文本
if child.hasChildNodes():
print "%s" % child.childNodes[0].data
print "</%s>" % child.nodeName
2.SAX
SAX最佳使用的地方就是查找某个元素的值
假设我们要取test.xml中字节点remote的属性name的值
__author__ = 'xuqiang' import xml
import xml.sax class TestHandler(xml.sax.ContentHandler):
def __init__(self):
self.to = ""
self.fromm = ""
self.heading = ""
self.body = ""
self.review = ""
self.name = ""
self.fetch = ""
self.remote = ""
self.defaultremote = ""
self.sync = ""
self.revision = ""
self.default = "" def startElement(self, tag, attributes):
self.CurrentData = tag
#找到节点remote的属性 name
if tag == 'remote':
print "remote name is %s" % attributes.get('name')
def endElement(self, tag):
if self.CurrentData == "to":
print "to:", self.to
elif self.CurrentData == "from":
print "from:", self.fromm
elif self.CurrentData == "heading":
print "heading:", self.heading
elif self.CurrentData == "body":
print "body:", self.body
elif self.CurrentData == "remote":
print "remote:", self.remote
elif self.CurrentData == "default":
print "default:", self.default
self.CurrentData = "" def characters(self, content):
if self.CurrentData == "to":
self.to = content
elif self.CurrentData == "from":
self.fromm = content
elif self.CurrentData == "heading":
self.heading = content
elif self.CurrentData == "body":
self.body = content
elif self.CurrentData == "remote":
self.remote = content
elif self.CurrentData == "default":
self.default = content parser = xml.sax.make_parser()
parser.setFeature(xml.sax.handler.feature_namespaces, 0)
Handler = TestHandler()
parser.setContentHandler(Handler)
parser.parse("test.xml")
DOM和SAX是最常见的解写xml的方式,这里python实现,java的实现基本差别不大
三、PULL
PULL是android中最常用的解析xml的方式。他的原理和SAX类似,是基于事件处理的。使用方法也类似。
我们以谷歌天气为例,这是我们从google官方网站上下载下来的xml格式的当天天气。
<?xml version="1.0" encoding="utf-8"?>
<current>
<city id="1796236" name="Shanghai">
<coord lon="121.46" lat="31.22"/>
<country>CN</country>
<sun rise="2015-12-13T22:44:16" set="2015-12-14T08:52:49"/>
</city>
<temperature value="283.15" min="283.15" max="283.15" unit="kelvin"/>
<humidity value="82" unit="%"/>
<pressure value="1024" unit="hPa"/>
<wind>
<speed value="5" name="Gentle Breeze"/>
<direction value="310" code="NW" name="Northwest"/>
</wind>
<clouds value="44" name="scattered clouds"/>
<visibility value="5000"/>
<precipitation mode="no"/>
<weather number="721" value="haze" icon="50d"/>
<lastupdate value="2015-12-14T03:00:00"/>
</current>
xml文件中参数比较多,我现在只想知道城市,温度,适度,风向四个值,建立一个数据结构CurrentWeatherXml来保存这四个值
package org.xerrard.xmlpulldemo;
public class CurrentWeatherXml {
public String city; //城市
public String temperature; // 温度
public String humidity; // 湿度
public String wind_direction; // 风向
public String toString()
{
//摄氏度(℃)=K-273。
float s = Float.parseFloat(temperature);
float temperatureC = s-273;
StringBuilder sb = new StringBuilder();
sb.append(" 城市: ").append(city);
sb.append(" 天气: ").append(temperature + "").append(" °K");
sb.append(" 天气: ").append(temperatureC + "").append(" °C");
sb.append(" 湿度 ").append(humidity);
sb.append(" 风向 ").append(wind_direction);
return sb.toString();
}
}
我们建立一个Model类来做xml的处理,在这个类中,我们对xml文件进行解析,从中抽取城市,天气,湿度,风向,并将其值存入到CurrentWeatherXml中
package org.xerrard.xmlpulldemo; import java.io.InputStream; import org.xmlpull.v1.XmlPullParser;
import org.xmlpull.v1.XmlPullParserFactory; import android.util.Log; public class WeatherXMLModel { public static CurrentWeatherXml curCondition = null; public static void initData(InputStream is){
try {
if(is != null){
XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
XmlPullParser parser = factory.newPullParser();
parser.setInput(is, "UTF-8");
int eventType = parser.getEventType();
while(eventType != XmlPullParser.END_DOCUMENT){
switch (eventType) {
case XmlPullParser.START_DOCUMENT:
Log.d("xerrard", "START_DOCUMENT=" + parser.getName());
break;
case XmlPullParser.START_TAG:
String name = parser.getName(); if("current".equals(name)){//current标签
Log.d("xerrard", "START_TAG=" + name);
curCondition = new CurrentWeatherXml();
}else if(curCondition != null){
if("city".equals(name)){ //city标签
curCondition.city = parser.getAttributeValue(1);
}
if("temperature".equals(name)){ //temperature标签
curCondition.temperature = parser.getAttributeValue(0);
}
if("humidity".equals(name)){ //humidity标签
curCondition.humidity = parser.getAttributeValue(0);
}
if("direction".equals(name)){ //direction标签
curCondition.wind_direction = parser.getAttributeValue(0);
}
} break; case XmlPullParser.END_TAG:
if("forecast_conditions".equals(parser.getName())){
Log.d("xerrard", "END_TAG=" + parser.getName());
}
break;
}
eventType = parser.next();
}
Log.d("xerrard", "curCondition--" + curCondition);
}
} catch (Exception e) {
e.printStackTrace();
}
} }
然后,我们就可以将xml文件作为参数传递给WeatherXmlModel,WeatherXmlModer处理完毕后,得到我们需要的数据CurrentWeatherXml。
InputStream inputStream = new FileInputStream(xmlFlie);
WeatherXMLModel.initData(inputStream);
CurrentWeatherXml weather = WeatherXMLModel.curCondition;
TextView hello = (TextView)findViewById(R.id.hello);
hello.setText(weather.toString());
参考资料:
googleweatherapi : http://openweathermap.org/current
http://blog.csdn.net/jdsjlzx/article/details/7215289 PULL解析google天气
Xml解析之——Java/Android/Python的更多相关文章
- XML解析详解|乐字节
大家好,乐字节的小乐又来了,Java技术分享哪里少的了小乐!上次我们说了可扩展标记语言XML之二:XML语言格式规范.文档组成,本文将介绍重点——XML解析. 基本的解析方式有两种:一种叫 SAX ...
- 【Android】实现XML解析的几种技术
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
- JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析(8)
1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直 ...
- android XMl 解析神奇xstream 六: 把集合list 转化为 XML文档
前言:对xstream不理解的请看: android XMl 解析神奇xstream 一: 解析android项目中 asset 文件夹 下的 aa.xml 文件 android XMl 解析神奇xs ...
- android XMl 解析神奇xstream 五: 把复杂对象转换成 xml ,并写入SD卡中的xml文件
前言:对xstream不理解的请看: android XMl 解析神奇xstream 一: 解析android项目中 asset 文件夹 下的 aa.xml 文件 android XMl 解析神奇xs ...
- android XMl 解析神奇xstream 四: 将复杂的xml文件解析为对象
前言:对xstream不理解的请看: android XMl 解析神奇xstream 一: 解析android项目中 asset 文件夹 下的 aa.xml 文件 android XMl 解析神奇xs ...
- android XML解析器全解案例
1.使用pull解析 package com.example.myxml; import java.io.InputStream; import java.util.ArrayList; import ...
- Android中级之网络数据解析一之xml解析
本文来自http://blog.csdn.net/liuxian13183/ ,引用必须注明出处! --Comic Sans MS Xml解析具有跨平台性,语言无关性,易操作性,因此广受开发者的欢迎. ...
- Android实现XML解析技术
转载:Android实现XML解析技术 本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为 ...
随机推荐
- 如何从BBC网站学习英语
- Cortex-M0系统滴答定时器Systick详解
上图是LPC1114系统滴答定时器(SysTick)的结构图.系统滴答定时器位于Cortex-M0内核中,也就是说,不论是LPC1114,还是其他的Cortex-M0内核单片机,都有这个系统定时器.其 ...
- 协程coroutine
协程(coroutine)顾名思义就是“协作的例程”(co-operative routines).跟具有操作系统概念的线程不一样,协程是在用户空间利用程序语言的语法语义就能实现逻辑上类似多任务的编程 ...
- “adb server is out of date. killing.... ADB server didn't ACK * failed to start daemon * ”
草泥马的adb: “adb server is out of date. killing.... ADB server didn't ACK * failed to start daemon * ” ...
- 【HDOJ】2266 How Many Equations Can You Find
简单DFS. #include <cstdio> #include <cstring> #define MAXN 15 char str[MAXN]; __int64 x; i ...
- 网络编程-pcap数据包格式
Libpcap的官方网站是http://www.tcpdump.org/,该项目和Tcpdump项目是同一个团队维护.Libpcap是一个平台独立的 数据包捕获开发包,制定了数据包离线存储的事实标准. ...
- Tomcat死机报OutOfMemoryError: PermGen space错误
最近,用户没怎么使用系统,页面就卡死,访问不了.仔细一看是Tomcat假死,好几次都这样.重启也慢的很,很着急.最后,看了下 conf/logs 里的配置文件,发现是 OutOfMemoryError ...
- sublime text3安装SublimeREPL--解决不能运行input()的问题
原文地址:http://blog.chinaunix.net/uid-12014716-id-4269991.html 一.安装包管理器(如果已经安装可以忽略) 1.简单的安装方法:使用Ctrl+`快 ...
- 《JavaScript语言精髓与编程实践》读书笔记二
第3章非函数式语言特性 这一章首先介绍了语言的分类,命令式(结构化编程,面向对象编程),说明式(函数式等).而这一章,主要介绍JS的非函数式特点. 在开始之前,首先介绍了由“结构化编程”向“面向对象编 ...
- windows下python安装paramiko
Python中使用SSH需要用到OpenSSH,而OpenSSH依赖于paramiko模块,而paramiko模块又依赖于pycrypto模块,因此要在Python中使用SSH,则需要先安装模块顺序是 ...