JAVA与DOM解析器基础 学习笔记
文件对象模型(Document Object Model,简称DOM),是W3C组织推荐的处理可扩展置标语言的标准编程接口。各种语言可以按照DOM规范给出解析XML文件的解析器。Sun公司发布的JDK1.4的后续版本中提供了解析XML文件的网API(Java API for XML Processing)。关于XML语法请参考这里。为什么没有对java类和实际对象没做详细说明,我已经到代码中写了注释了,到这里就不做过多的说明了。
检测命名空间:TestNameSpace.java
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler; /**
* 检查命xml标记的命名空间
* @author licheng
*
*/
public class TestNameSpace {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
SAXParserFactory factory=SAXParserFactory.newInstance(); //语法解析器的工厂对象
factory.setNamespaceAware(true); //允许使用命名空间
try {
SAXParser saxParser=factory.newSAXParser(); //获取语法解析器
MyHeader handle=new MyHeader(); //创建输出句柄
saxParser.parse(new File("student.xml"), handle); //开始语法解析 文件放到项目根目录不是WebRoot
} catch (Exception e) { //抛出异常
// TODO Auto-generated catch block
e.printStackTrace();
}
} } /**
* 创建输出句柄对象
* @author Administrator
*
*/
class MyHeader extends DefaultHandler{
@Override //覆盖父类的方法
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
if(uri.length()>0)
System.out.println("标记:"+localName+"的命名空间是:"+uri);
else
System.out.println("标记:"+localName+"没有命名空间");
}
}
浏览器中的DOM解析器只检测XML文件是否是规范的,而不能检测XML文件的有效性,此时我们可以使用JAVA提供的DOM解析器来检查一个XML文件的有效性:
TestValidate.java
import java.io.File;
import java.io.IOException;
import java.util.Scanner; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document;
import org.xml.sax.SAXException;
import org.xml.sax.SAXParseException;
import org.xml.sax.helpers.DefaultHandler; /**
* 检查XML文件的有效性
* 浏览器中的XML解析器只检查XML文件是否是规范的,并不检查XML文件是否遵守DTD规定的约束条件。
* 此时就可以使用DOM解析器来检查一个XML文件是否是有效的。
* @author licheng
*
*/
public class TestValidate { public static void main(String[] args) {
String fileName=null;
Scanner reader=new Scanner(System.in);
System.out.print("请输入要验证有效性的XML的文件:");
fileName=reader.nextLine(); //从控制台读取一行数据
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); //DocumentBuilderFactory工厂对象 获取自身实例
factory.setValidating(true); //设置有效性检测为真
try {
DocumentBuilder builer=factory.newDocumentBuilder();//获取DOM解析器
MyHandler handler=new MyHandler(); //创建MyHandler实例
builer.setErrorHandler(handler); // 设置解析器的错误句柄为 MyHandler的实例
Document document=builer.parse(new File(fileName)); //DOM解析器解析 XML文件
if(handler.errorMessage==null){ //判断handler对象是否含有错误信息
System.out.print(fileName+"文件是效的");
}else{
System.out.print(fileName+"文件是无效的");
} } catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
} } } /**
* 创建输出句柄
* @author Administrator
*
*/
class MyHandler extends DefaultHandler{ String errorMessage=null;
/**
* 一般性错误
*/
public void error(SAXParseException e) throws SAXException {
errorMessage=e.getMessage();
System.out.print("一般错误:"+ errorMessage);
} /*
*
* 致命错误 程序终止
*/
public void fatalError(SAXParseException e) throws SAXException {
errorMessage=e.getMessage();
System.out.print("致命错误:"+ errorMessage);
} }
获取XML声明信息,根节点名称,指定节点的信息:JAXPOne.java
import java.io.File;
import java.io.IOException; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException; /**
* JAVA DOM解析器入门
* 输出书籍信息
* @author licheng
*
*/
public class JAXPOne { public static void main(String[] args) {
// DocumentBuilderFactory对象调用newInstance方法实例化一个DocumentBuilderFactory对象
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
try {
//factory对象调用newDocumentBuilder创建 domParser DOM解析器
DocumentBuilder domParser=factory.newDocumentBuilder();
try { Document document=domParser.parse(new File("student.xml"));
String version=document.getXmlVersion(); //获取XML版本号
System.out.println("version:"+version); String encoding=document.getXmlEncoding(); //获取声明编码
System.out.println("encoding:"+encoding); Element root=document.getDocumentElement(); //获取根节点 是先要获取根节点吗
String rootName=root.getNodeName(); //获取节点的名称
System.out.println("rootName:"+rootName);
System.out.println(rootName+"类型为:"+root.getNodeType()); //获取节点类型 dom的级别 NodeList nodelist=root.getElementsByTagName("book"); //获取节点列表
int size=nodelist.getLength();
for(int k=0;k<size;k++){
Node node=nodelist.item(k); //获取节点
String name=node.getNodeName(); //节点名称
String content=node.getTextContent(); //获取内容 包含子孙节点中的文本数据
System.out.println(name+":"+content);
//System.out.println(name+"节点类型:"+node.getNodeType()); //获取节点类型 dom的级别
} } catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
} }
使用递归方法输出节点中的数据:JAXPTwo.java
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException; /**
* 递归方法输出节点中的数据
* @author licheng
*
*/
public class JAXPTwo { /**
*主函数
*/
public static void main(String[] args) {
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
try {
DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("bookinfo.xml"));
NodeList nodeList=document.getChildNodes();
output(nodeList);
} catch (Exception e) {
e.printStackTrace();
} } /**
* 递归输出节点数据
* @param nodelist 节点列表
*/
public static void output(NodeList nodelist){
int size=nodelist.getLength(); //获取接点列表的长度
for(int k=0;k<size;k++){
Node node=nodelist.item(k); //获取节点列表中的一项
if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT
Text textNode=(Text)node;
String content=textNode.getWholeText();
System.out.print(content);
}
if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT
Element elementNode=(Element)node;
String name=elementNode.getNodeName();
System.out.print(name);
NodeList nodes=elementNode.getChildNodes();
output(nodes); //递归掉用该方法
}
} } }
输出Text节点信息,统计一共有多少个Text文本节点:JAXPText.java
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException; /**
* 统计一共有多少个Text节点
* @author licheng
*
*/
public class JAXPText { /**
*主函数
*/
public static void main(String[] args) {
GiveData give=new GiveData();
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
try {
DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("bookinfo.xml"));
NodeList nodeList=document.getChildNodes();
give.output(nodeList);
System.out.println("一共有"+give.m+"个Text节点");
} catch (Exception e) {
e.printStackTrace();
} } } class GiveData{
int m=0; //text的个数
public void output(NodeList nodelist){
int size=nodelist.getLength(); //获取接点列表的长度
for(int k=0;k<size;k++){
Node node=nodelist.item(k); //获取节点列表中的一项
if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT
Text textNode=(Text)node;
String content=textNode.getWholeText();
m++;
System.out.print(content);
}
if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT
Element elementNode=(Element)node;
String name=elementNode.getNodeName();
System.out.print(name);
NodeList nodes=elementNode.getChildNodes();
output(nodes); //递归掉用该方法
}
} }
}
获取Attr属性节点信息:JAXPAttr.java
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException; /**
* 遍历属性节点信息
* @author licheng
*
*/
public class JAXPAttr { /**
*主函数
*/
public static void main(String[] args) {
GiveData3 give=new GiveData3(); try {
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进
DocumentBuilder domParser=factory.newDocumentBuilder();
Document document=domParser.parse(new File("student.xml"));
Element root=document.getDocumentElement();
NodeList nodeList=root.getChildNodes();
give.output(nodeList); } catch (Exception e) {
e.printStackTrace();
} } } class GiveData3{ public void output(NodeList nodelist){
int size=nodelist.getLength(); //获取接点列表的长度
for(int k=0;k<size;k++){
Node node=nodelist.item(k); //获取节点列表中的一项
if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT
Text textNode=(Text)node;
String content=textNode.getWholeText();
System.out.print(content);
}
if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT
Element elementNode=(Element)node;
String name=elementNode.getNodeName();
System.out.print(name);
NamedNodeMap map=elementNode.getAttributes(); //获取属性节点集合
/**
* 属性节点操作
*/
for(int m=0;m<map.getLength();m++){
Attr attrNode=(Attr)map.item(m);
String attrName=attrNode.getName(); //属性名称
String attrValue=attrNode.getValue(); //属性值
System.out.print(" "+attrName+"="+attrValue);
}
NodeList nodes=elementNode.getChildNodes();
output(nodes); //递归掉用该方法
}
} }
}
忽略文本空白:JAXPEight.java
import java.io.IOException; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException; public class JAXPEight { public static void main(String[] args) {
GiveD give=new GiveD();
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
factory.setIgnoringElementContentWhitespace(true); //这个确实是可行的吗??
try {
DocumentBuilder domPaser=factory.newDocumentBuilder();
Document document=domPaser.parse("student.xml");
Element root=document.getDocumentElement();
NodeList nodeList=root.getChildNodes(); give.output(nodeList); } catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
} } class GiveD{
int m=0;
public void output(NodeList nodeList){
int size=nodeList.getLength();
for(int k=0;k<size;k++){
Node node=nodeList.item(k);
if(node.getNodeType()==Node.TEXT_NODE){
Text textNode=(Text)node;
String content=textNode.getWholeText();
m++;
System.out.print(content);
}
if(node.getNodeType()==Node.ELEMENT_NODE){
Element elementNode=(Element)node;
String name=elementNode.getNodeName();
System.out.print(" ");
NodeList nodes=elementNode.getChildNodes();
output(nodes);
}
}
} }
[使用DOM生成XML文件]此类通过已经存在的文件 获取Document对象 修改DOM后 创建XML文件:JAXPTransformer.java
import java.io.File;
import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; /**
* 通过已经存在的文件 获取Document对象
* 修改DOM后
* DOM创建XML文件
* @author licheng
*
*/
public class JAXPTransformer {
public static void main(String[] args) { ModifyNode modify=new ModifyNode();
try {
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进
DocumentBuilder domParser=factory.newDocumentBuilder();
Document document=domParser.parse(new File("mobileNumber.xml")); //通过已经存在的文件创建Document对象
Element root=document.getDocumentElement();
NodeList nodeList=root.getChildNodes();
modify.modifyNode(nodeList, document); //调用修改DOM的方法
TransformerFactory transFactory=TransformerFactory.newInstance(); //工厂对象获取transFactory实例
Transformer transformer=transFactory.newTransformer(); //获取Transformer实例
DOMSource domSource=new DOMSource(document);
File file=new File("newXML.xml");
FileOutputStream out=new FileOutputStream(file);
StreamResult xmlResult=new StreamResult(out);
transformer.transform(domSource, xmlResult); out.close();
} catch (Exception e) {
e.printStackTrace();
} }
}
class ModifyNode{
int m=0;
Document document;
public void modifyNode(NodeList nodeList,Document document){
this.document=document;
int size=nodeList.getLength();
for(int k=0;k<size;k++){
Node node=nodeList.item(k);
if(node.getNodeType()==Node.ELEMENT_NODE){
Element elementNode=(Element)node; //这里获取节点
String name=elementNode.getNodeName();//节点名称
if(name.equals("用户")){ //节点判断
m++;
Node textN=document.createTextNode("80元"); //创建文本节点
Node elementN=document.createElement("月租费"); //穿件节点
elementN.appendChild(textN);
elementNode.appendChild(elementN);
}
NodeList nodes=elementNode.getChildNodes();
modifyNode(nodes, document); //此处递归
}
} } }
[使用DOM生成XML文件]上例中通过已有的XML文件产生一个Document对象,而本例直接 调用 newDocument()方法获取对象。
JAXPTransformer2.java
import java.io.File;
import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; /**
* domPaser 调用 newDocument() 方法获取Document对象
* 然后为Document节点添加子孙节点
* 使用Transformer生成一个新的XML文件
* @author licheng
*
*/
public class JAXPTransformer2 {
public static void main(String[] args) {
try {
String[] personName={"张三","李四","王五"};
String[] phoneNumber={"123","456","789"};
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进
DocumentBuilder domParser=factory.newDocumentBuilder();
Document document=domParser.newDocument(); //通过调用newDocument() 方法获取实例
document.setXmlVersion("1.0"); //设置 xml版本号
Element root=document.createElement("手机用户表");
document.appendChild(root); //添加根节点
for(int k=1;k<=personName.length;k++){
Node node=document.createElement("用户"); //添加多个用户节点
root.appendChild(node);
}
NodeList nodeList=document.getElementsByTagName("用户");
int size=nodeList.getLength();
for(int k=0;k<size;k++){
Node node=nodeList.item(k);
if(node.getNodeType()==Node.ELEMENT_NODE){
Element elementNode=(Element)node; //有必要创建此对象吗???
Node nodeName=document.createElement("姓名");
Node nodeNumber=document.createElement("号码");
nodeName.appendChild(document.createTextNode(personName[k]));
nodeNumber.appendChild(document.createTextNode(phoneNumber[k]));
elementNode.appendChild(nodeName);
elementNode.appendChild(nodeNumber);
}
}
TransformerFactory transFactory=TransformerFactory.newInstance(); //工厂对象获取transFactory实例
Transformer transformer=transFactory.newTransformer(); //获取Transformer实例
DOMSource domSource=new DOMSource(document);
File file=new File("phone.xml");
FileOutputStream out=new FileOutputStream(file);
StreamResult xmlResult=new StreamResult(out);
transformer.transform(domSource, xmlResult);
out.close(); } catch (Exception e) {
e.printStackTrace();
} }
}
JAVA与DOM解析器基础 学习笔记的更多相关文章
- JAVA与DOM解析器提高(DOM/SAX/JDOM/DOM4j/XPath) 学习笔记二
要求 必备知识 JAVA基础知识.XML基础知识. 开发环境 MyEclipse10 资料下载 源码下载 sax.dom是两种对xml文档进行解析的方法(没有具体实现,只是接口),所以只有它们是无 ...
- 尚学堂JAVA基础学习笔记
目录 尚学堂JAVA基础学习笔记 写在前面 第1章 JAVA入门 第2章 数据类型和运算符 第3章 控制语句 第4章 Java面向对象基础 1. 面向对象基础 2. 面向对象的内存分析 3. 构造方法 ...
- Java基础学习笔记总结
Java基础学习笔记一 Java介绍 Java基础学习笔记二 Java基础语法之变量.数据类型 Java基础学习笔记三 Java基础语法之流程控制语句.循环 Java基础学习笔记四 Java基础语法之 ...
- Java基础学习笔记(一)
Java基础学习笔记(一) Hello World 基础代码学习 代码编写基础结构 class :类,一个类即一个java代码,形成一个class文件,写于每个代码的前端(注意无大写字母) XxxYy ...
- Java DOM解析器 - 解析XML文档
使用DOM的步骤 以下是在使用DOM解析器解析文档使用的步骤. 导入XML相关的软件包. 创建DocumentBuilder 从文件或流创建一个文档 提取根元素 检查属性 检查子元素 导入XML相关的 ...
- Java DOM解析器
文档对象模型是万维网联盟(W3C)的官方推荐.它定义了一个接口,使程序能够访问和更新样式,结构和XML文档的内容.支持DOM实现该接口的XML解析器. 何时使用? 在以下几种情况时,应该使用DOM解析 ...
- dom解析器机制 web基本概念 tomcat
0 作业[cn.itcast.xml.sax.Demo2] 1)在SAX解析器中,一定要知道每方法何时执行,及SAX解析器会传入的参数含义 1 理解dom解析器机制 1)dom解析和dom4j原理 ...
- 《JavaScript DOM 编程艺术》 学习笔记
目录 <JavaScript DOM 编程艺术> 学习笔记 第一章 js简史 第二章 js语法 准备工作 语法 第三章 DOM DOM中的D DOM中的O DOM中的M 第四章 js图片库 ...
- 20145213《Java程序设计》第八周学习笔记
20145213<Java程序设计>第八周学习笔记 教材学习内容总结 "桃花春欲尽,谷雨夜来收"谷雨节气的到来意味着寒潮天气的基本结束,气温回升加快.刚出冬的我对于这种 ...
随机推荐
- Redis的appendfsync参数详解
redis.conf中的appendfysnc是对redis性能有重要影响的参数之一.可取三种值:always.everysec和no. 设置为always时,会极大消弱Redis的性能,因为这种模式 ...
- MyBatis(二)最简易的增、删、改、查
这篇是承接上一篇的helloWorld程序.首先将一系列初始化的步骤再做一个工厂类进行包装,代码如下: package com.tinaluo.sun; import java.io.InputStr ...
- jquery扩展实现input框字符长度限制中文2个字符,英文1个字符
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...
- C#期末大作业 消消乐 2017-06-01 18:11 275人阅读 评论(0) 收藏
邻近期末,忙于刷题之余意识到期末大作业来不及了,匆匆赶下了作业,虽说做的很是粗糙,但完全原创的 下载链接 https://pan.baidu.com/s/1cCNLr4 大体的做大约3天完成了: 第一 ...
- Naive Bayes 笔记
Naive Bayes (朴素贝叶斯) 属于监督学习算法, 它通过计算测试样本在训练样本各个分类中的概率来确定测试样本所属分类, 取最大概率为其所属分类. 优点 在数据较少的情况下仍然有效,可以处 ...
- python3使用ip地址代理
第一种IP地址代理方式from urllib import request if __name__ == "__main__": # 访问网址 url = 'http://www. ...
- shell 命令 netstat 查看端口占用
netstat 查看 8888端口的占用情况
- 查询指定网段可用IP脚
方法一:linux命令 1.fping安装: yum install fping 2.fping使用: fping -g ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ...
- centos7 搭建WEB服务器
centos7 搭建WEB服务器 2017年09月17日 09:44:50 逝然1994 阅读数:18321 标签: centosapacheweb服务器 更多 个人分类: centos服务器简单配置 ...
- AngularJs从数据库获取数据并显示
哈哈,昨天下午和今天早上,花上一些时间,学习AngularJs,仅是粗略预览一下.很好,非常好. 由于手上有开发ASP.NET MVC环境,就在这测试下,去数据库获取数据并显示数据. 数据库表创建,添 ...