[置顶] stax解析xml文档的6种方式

原文链接：http://blog.csdn.net/u011593278/article/details/9745271

stax解析xml文档的方式：

基于光标的查询；
基于迭代模型的查找；
基于过滤器的查找；
基于xpath的查找；
使用 XMLStreamWriter 创建 xml 文档：
通过 Transformer 更新节点信息；

package com.zp.ws.test03;

import java.io.IOException;

import java.io.InputStream;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.stream.EventFilter;

import javax.xml.stream.FactoryConfigurationError;

import javax.xml.stream.XMLEventReader;

import javax.xml.stream.XMLInputFactory;

import javax.xml.stream.XMLOutputFactory;

import javax.xml.stream.XMLStreamConstants;

import javax.xml.stream.XMLStreamException;

import javax.xml.stream.XMLStreamReader;

import javax.xml.stream.XMLStreamWriter;

import javax.xml.stream.events.XMLEvent;

import javax.xml.transform.OutputKeys;

import javax.xml.transform.Result;

import javax.xml.transform.Transformer;

import javax.xml.transform.TransformerConfigurationException;

import javax.xml.transform.TransformerException;

import javax.xml.transform.TransformerFactory;

import javax.xml.transform.TransformerFactoryConfigurationError;

import javax.xml.transform.dom.DOMSource;

import javax.xml.transform.stream.StreamResult;

import javax.xml.xpath.XPath;

import javax.xml.xpath.XPathConstants;

import javax.xml.xpath.XPathExpressionException;

import javax.xml.xpath.XPathFactory;

import org.junit.Test;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

public class TestStax {

	/**

	 * 基于光标模型：

	 *

	 * 获取xml文件的元素和文本内容；

	 */

	@Test

	public void test01() {

		//实例化一个xml输入流工厂，创建一个xml文件读取器；

		XMLInputFactory factory = XMLInputFactory.newInstance();

		InputStream is = null;

		try {

			//获取xml文件的的输入流；

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			//创建一个XMLStreamReader，读取xml文件，获取相应内容；

			XMLStreamReader reader = factory.createXMLStreamReader(is);

			while(reader.hasNext()) {

				int type = reader.next();

				/**

				 * 判断节点类型是否是开始或者结束或者文本节点,之后根据情况及进行处理：

				 *

				 * START_ELEMENT：开始元素；

				 * CHARACTERS：文本；

				 * END_ELEMENT：结束元素；

				 *

				 * reader.getName()得先判断是什么节点，再输出name，否则会报错，因为文本节点没有name；

				 */

				if(type==XMLStreamConstants.START_ELEMENT) {

					System.out.println(reader.getName());

				} else if(type==XMLStreamConstants.CHARACTERS) {

					System.out.println(reader.getText().trim());

				} else if(type==XMLStreamConstants.END_ELEMENT) {

					System.out.println("/"+reader.getName());

				}

			}

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 基于光标模型：

	 *

	 * 获取指定元素名的属性名和属性值；

	 */

	@Test

	public void test02() {

		XMLInputFactory factory = XMLInputFactory.newInstance();

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			XMLStreamReader reader = factory.createXMLStreamReader(is);

			while(reader.hasNext()) {

				int type = reader.next();

				if(type==XMLStreamConstants.START_ELEMENT) {

					String name = reader.getName().toString();

					//获取元素名称为book的第一个属性名和属性值；

					if(name.equals("book")) {

						System.out.println(reader.getAttributeName(0)+":"+reader.getAttributeValue(0));

					}

				}

			}

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 基于光标模型：

	 *

	 * 获取xml文件指定元素的文本内容(元素的值)

	 */

	@Test

	public void test03() {

		XMLInputFactory factory = XMLInputFactory.newInstance();

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			XMLStreamReader reader = factory.createXMLStreamReader(is);

			while(reader.hasNext()) {

				int type = reader.next();

				if(type==XMLStreamConstants.START_ELEMENT) {

					String name = reader.getName().toString();

					//获取名为"title"的元素的文本内容(元素的值)

					if(name.equals("title")) {

						System.out.print(reader.getElementText()+":");

					}

					//获取名为"price"的元素的文本内容(元素的值)

					if(name.equals("price")) {

						System.out.print(reader.getElementText()+"\n");

					}

				}

			}

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 基于迭代模型：

	 *

	 * 获取xml文件指定元素的文本内容(元素的值)

	 *

	 * 迭代次数：本次测试时85；

	 *

	 * 根据迭代次数和过滤模型相比，过滤模型的远高于迭代模型的；

	 */

	@Test

	public void test04() {

		XMLInputFactory factory = XMLInputFactory.newInstance();

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			//基于迭代模型的操作方式

			XMLEventReader reader = factory.createXMLEventReader(is);

			int num = 0;

			while(reader.hasNext()) {

				//通过XMLEvent来获取是否是某种节点类型

				XMLEvent event = reader.nextEvent();

				if(event.isStartElement()) {

					//通过event.asxxx转换节点类型；

					String name = event.asStartElement().getName().toString();

					if(name.equals("title")) {

						System.out.print(reader.getElementText()+":");

					}

					if(name.equals("price")) {

						System.out.print(reader.getElementText()+"\n");

					}

				}

				num++;

			}

			//返回迭代次数是：85；

			System.out.println(num);

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 基于过滤模型：

	 *

	 * 获取xml文件指定元素的文本内容(元素的值)

	 *

	 * 加过滤器后的迭代次数：本次测试结果：8；

	 *

	 * 所以可以得到的结果是：使用过滤模型的效率远高于迭代模型；

	 */

	@Test

	public void test05() {

		XMLInputFactory factory = XMLInputFactory.newInstance();

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			//基于Filter的过滤方式，可以有效的过滤掉不用进行操作的节点，效率会高一些

			XMLEventReader reader = factory.createFilteredReader(factory.createXMLEventReader(is),

					new EventFilter() {

						@Override

						public boolean accept(XMLEvent event) {

							//返回true表示会显示，返回false表示不显示

							if(event.isStartElement()) {

								String name = event.asStartElement().getName().toString();

								if(name.equals("title")||name.equals("price"))

									return true;

							}

							return false;

						}

					});

			int num = 0;

			while(reader.hasNext()) {

				//通过XMLEvent来获取是否是某种节点类型

				XMLEvent event = reader.nextEvent();

				if(event.isStartElement()) {

					//通过event.asxxx转换节点

					String name = event.asStartElement().getName().toString();

					if(name.equals("title")) {

						System.out.print(reader.getElementText()+":");

					}

					if(name.equals("price")) {

						System.out.print(reader.getElementText()+"\n");

					}

				}

				num++;

			}

			//返回迭代次数：8；

			System.out.println(num);

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 基于XPath ：XPath 是一门在 XML 文档中查找信息的语言；

	 */

	@Test

	public void test06() {

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			//创建文档处理对象

			DocumentBuilder db = DocumentBuilderFactory.newInstance().newDocumentBuilder();

			//通过DocumentBuilder创建doc的文档对象

			Document doc = db.parse(is);

			//创建XPath

			XPath xpath = XPathFactory.newInstance().newXPath();

			//第一个参数就是xpath,第二参数就是文档

			NodeList list = (NodeList)xpath.evaluate("//book[@category='WEB']", doc,XPathConstants.NODESET);

			for(int i=0;i<list.getLength();i++) {

				//遍历输出相应的结果

				Element e = (Element)list.item(i);

				System.out.println(e.getElementsByTagName("title").item(0).getTextContent());

			}

		} catch (ParserConfigurationException e) {

			e.printStackTrace();

		} catch (SAXException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		} catch (XPathExpressionException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

	/**

	 * 使用 XMLStreamWriter 创建 xml 文档：

	 */

	@Test

	public void test07() {

		try {

			XMLStreamWriter xsw = XMLOutputFactory.newInstance().createXMLStreamWriter(System.out);

			xsw.writeStartDocument("UTF-8","1.0");

			xsw.writeEndDocument();

			String ns = "http://11:dd";

			xsw.writeStartElement("nsadfsadf","person",ns);

			xsw.writeStartElement(ns,"id");

			xsw.writeCharacters("1");

			xsw.writeEndElement();

			xsw.writeEndElement();

			xsw.flush();

			xsw.close();

		} catch (XMLStreamException e) {

			e.printStackTrace();

		} catch (FactoryConfigurationError e) {

			e.printStackTrace();

		}

	}

	/**

	 * 通过 Transformer 更新节点信息；

	 */

	@Test

	public void test08() {

		InputStream is = null;

		try {

			is = TestStax.class.getClassLoader().getResourceAsStream("com/zp/ws/test03/books.xml");

			//创建文档处理对象

			DocumentBuilder db = DocumentBuilderFactory.newInstance().newDocumentBuilder();

			//通过DocumentBuilder创建doc的文档对象

			Document doc = db.parse(is);

			//创建XPath

			XPath xpath = XPathFactory.newInstance().newXPath();

			Transformer tran = TransformerFactory.newInstance().newTransformer();

			tran.setOutputProperty(OutputKeys.ENCODING,"UTF-8");

			tran.setOutputProperty(OutputKeys.INDENT, "yes");

			//第一个参数就是xpath,第二参数就是文档

			NodeList list = (NodeList)xpath.evaluate("//book[title='Learning XML']", doc,XPathConstants.NODESET);

			//获取price节点

			Element be = (Element)list.item(0);

			Element e = (Element)(be.getElementsByTagName("price").item(0));

			e.setTextContent("333.9");

			//通过输出流创建一个结果；

			Result result = new StreamResult(System.out);

			//通过tranformer修改节点

			tran.transform(new DOMSource(doc), result);

		} catch (ParserConfigurationException e) {

			e.printStackTrace();

		} catch (SAXException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		} catch (XPathExpressionException e) {

			e.printStackTrace();

		} catch (TransformerConfigurationException e) {

			e.printStackTrace();

		} catch (TransformerFactoryConfigurationError e) {

			e.printStackTrace();

		} catch (TransformerException e) {

			e.printStackTrace();

		} finally {

			try {

				//关闭读取xml文件的输入流；

				if(is!=null) is.close();

			} catch (IOException e) {

				e.printStackTrace();

			}

		}

	}

}

books.xml文件代码：

<?xml version="1.0" encoding="UTF-8"?>

<bookstore>

<book category="COOKING">

  <title lang="en">Everyday Italian</title>

  <author>Giada De Laurentiis</author>

  <year>2005</year>

  <price>30.00</price>

</book>

<book category="CHILDREN">

  <title lang="en">Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

<book category="WEB">

  <title lang="en">XQuery Kick Start</title>

  <author>James McGovern</author>

  <author>Per Bothner</author>

  <author>Kurt Cagle</author>

  <author>James Linn</author>

  <author>Vaidyanathan Nagarajan</author>

  <year>2003</year>

  <price>49.99</price>

</book>

<book category="WEB">

  <title lang="en">Learning XML</title>

  <author>Erik T. Ray</author>

  <year>2003</year>

  <price>39.95</price>

</book>

</bookstore>

[置顶] stax解析xml文档的6种方式的更多相关文章

Java高级特性第14节解析XML文档(2) - SAX 技术
一.SAX解析XML文档 SAX的全称是Simple APIs for XML,也即XML简单应用程序接口.与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式.当使用S ...
网络电视精灵~分析~~~~~~简单工厂模式，继承和多态，解析XML文档，视频项目
小总结: 所用技术: 01.C/S架构,数据存储在XML文件中 02.简单工厂模式 03.继承和多态 04.解析XML文档技术 05.深入剖析内存中数据的走向 06.TreeView控件的使用核心: ...
使用dom4j解析XML文档
dom4j的包开源包,不属于JDK里面,在myeclipse中要单独导入在项目中,这里不累赘了做这个过程,很慢,因为很多方法没用过不熟悉,自己得去查帮助文档,而且还得去试,因为没有中文版,英文翻译不 ...
四种生成和解析XML文档的方法详解（介绍+优缺点比较+示例）
众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml- ...
java解析xml文档(dom)
DOM解析XML文档读取本地的xml文件,通过DOM进行解析,DOM解析的特点就是把整个xml文件装载入内存中,形成一颗DOM树形结构,树结构是方便遍历和和操纵. DOM解析的特性就是读取xml文件 ...
java 解析XML文档
Java 解析XML文档一.解析XML文档方式: 1.DOM方式:将整个XML文档读取到内存中,按照XML文件的树状结构图进行解析. 2.SAX方式:基于事件的解析,只需要加载XML中的部分数据,优 ...
DOM生成XML文档与解析XML文档(JUNIT测试)
package cn.liuning.test; import java.io.File; import java.io.IOException; import javax.xml.parsers.D ...
Objective-C ,ios,iphone开发基础:使用GDataXML解析XML文档,(libxml/tree.h not found 错误解决方案)
使用GDataXML解析XML文档在IOS平台上进行XML文档的解析有很多种方法,在SDK里面有自带的解析方法,但是大多情况下都倾向于用第三方的库,原因是解析效率更高.使用上更方便这里主要介绍一下 ...
浅谈用java解析xml文档（四）
继续接上一文,这一阵子因为公司项目加紧,导致最后一个解析xml文档的方式,还没有总结,下面总结使用dom4J解析xml. DOM4J(Document Object Model for Java) 使 ...

随机推荐

[Sciter系列] MFC下的Sciter–2.Sciter中的事件,tiscript,语法
[Sciter系列] MFC下的Sciter–2.Sciter中的事件,tiscript,CSS部分自觉学习,重点说明Tiscript部分的常见语法和事件用法. 本系列文章的目的就是一步步构建出一个功 ...
Java [leetcode 5] Longest Palindromic Substring
问题描述: Given a string S, find the longest palindromic substring in S. You may assume that the maximum ...
java transient简介
我们都知道一个对象只要实现了Serilizable接口,这个对象就可以被序列化,java的这种序列化模式为开发者提供了很多便利,我们可以不必关系具体序列化的过程,只要这个类实现了Serilizable ...
mysql使用经验总结
在工作中难免会遇到一些这个问题那个问题,当然在mysql中也不例外.今天就让我们来学学mysql中一些比较常用的东西 . 1.有时我们想去查某张表中的字段,但是表中的数据多,字段也很多,如果用sel ...
在window server 2008 64位系统上发布网站的过程中遇到的问题(转)
发布网站的过程如下: 1.安装数据库系统2.建立数据库,执行sql3.安装iis4.在本地机子上发布网站5.把发布好的东西拷贝到IIS上 1.安装数据库系统: 出现错误:必须使用角色管理工具安装或配 ...
HDU 4035Maze(树状+概率dp，绝对经典）
题意: 给你n个节点的树,从1节点开始走,到每个节点都有三种情况,被杀死回到1节点,找到隐藏的出口出去,沿着当前节点相邻的边走到下一个节点,给出每个节点三种情况发生的概率分别为ki,ei,1-ki-e ...
HDU 4405-Aeroplane chess（概率dp）
题意: n+1格飞行棋,编号0-n,从0格开始,每次扔一个色子,得到的点数就向前走几步,但有有些格子到达后可以直接飞到后面的格子, 当到达>=n的地方结束,求结束扔色子的期望次数. 分析: dp ...
codeforces 696B Puzzles 树形概率计算
题意:给一棵有根树,从根节点深搜,每次随机走,问每个点的dfs序的期望是多少分析:对于每一个点,它的所有祖先节点dfs序肯定在它之前,它所在的子树的节点一定在它后面, 剩下的是既不是子树又不是祖先的 ...
祭奠我的csdn博客
本人在csdn的博客莫名其妙地被封了(http://blog.csdn.net/fty8788),非常郁闷. 回忆起,可能是我近半年由于工作事情忙很少写博客了,被某213盗用发了不恰当的东东.我也查不 ...
dwr消息推送
闲来无事,把自己关于对dwr消息推送的实现过程描述一番. 首先第一步,当然在工程中是加入dwr.jar了,接着在web.xml中配置以下代码 <servlet> <servlet-n ...

[置顶] stax解析xml文档的6种方式

[置顶] stax解析xml文档的6种方式的更多相关文章

随机推荐

热门专题