用DOM4J包实现对xml文件按属性分离。

转自本人博客：http://www.xgezhang.com/dom4j_xml_separata.html

dom4j是一个Java的XML API。类似于jdom。用来读写XML文件的。

dom4j是一个十分优秀的Java XML API，具有性能优异、功能强大和极其易使用的特点。同一时候它也是一个开放源码的软件。能够在SourceForge上找到它。在IBM developerWorks上面还能够找到一篇文章，对主流的Java XML API进行的性能、功能和易用性的评測，所以能够知道dom4j不管在哪个方面都是很出色的。

相比于Dom。don4j的使用更加有”Java”的感觉，也更加方便。

仅仅要知道xml文件的树形结构，便能够对节点进行加入、改动、删除等工作

任务的目标是要把例如以下的xml文件，依照公司、即属性comp_name不同，分别分成两个xml文件。并把子节点中的全部属性提取出来放到元素中。

原始xml文件：

<?

xml version="1.0"?

>

<!-- edited with XMLSPY v2004 rel. 4 U (http://www.xmlspy.com) by Mr. Nobody (Altova GmbH) -->

<purchaseOrders>

<purchaseOrder comp_name="ABC">

    <shipTo export-code="1" type="EU-Address">

        <name>Helen Zoe</name>

        <street>47 Eden Street</street>

        <city>Cambridge</city>

        <postcode>126</postcode>

    </shipTo>

        <item partNum="128-UL">

            <productName>Jade earring</productName>

            <quantity>5</quantity>

            <price>179.90</price>

            <shipDate>2000-02-14</shipDate>

        </item>

    </Items>

</purchaseOrder>

<purchaseOrder comp_name="IBM">

    <shipTo export-code="3" type="US-Address">

        <name>Google</name>

        <street>47 Eden Street</street>

        <city>Pal alto</city>

        <postcode>95126</postcode>

    </shipTo>

        <item partNum="1289-UL">

            <productName>Jade earring</productName>

            <quantity>5</quantity>

            <price>179.90</price>

            <shipDate>2000-02-14</shipDate>

        </item>

    </Items>

</purchaseOrder>

<purchaseOrder comp_name="ABC">

    <shipTo export-code="4" type="EU-Address">

        <name>Zou</name>

        <street>47 Eden Street</street>

        <city>Cambridge</city>

        <postcode>126</postcode>

    </shipTo>

    <billTo type="US-Address">

        <name>Robert Smith</name>

        <street>8 Oak Avenue</street>

        <city>X Town</city>

        <state>AK</state>

        <zip>95819</zip>

    </billTo>

    <Items>

        <item partNum="101AA">

            <productName>Lapis necklace</productName>

            <quantity>4</quantity>

            <price>199.95</price>

            <comment>The Gifts for the holidays!</comment>

            <shipDate>1999-12-05</shipDate>

        </item>

        <item partNum="1281-UL">

            <productName>Jade earring</productName>

            <quantity>5</quantity>

            <price>179.90</price>

            <shipDate>2000-02-14</shipDate>

        </item>

    </Items>

</purchaseOrder>

</purchaseOrders>

须要生成两个文件，分别为ABC.xml和IBM.xml 例如以下：

ABC:<?xml version="1.0" encoding="UTF-8"?>

<purchaseOrders>

    <ABC_COMP>

        <purchaseOrder>

            <item>

                <partNum>229-OB</partNum>

                <productName>Pearl necklace</productName>

                <quantity>1</quantity>

                <price>4879.00</price>

                <shipDate>1999-12-05</shipDate>

            </item>

            <item>

                <partNum>128-UL</partNum>

                <productName>Jade earring</productName>

                <quantity>5</quantity>

                <price>179.90</price>

                <shipDate>2000-02-14</shipDate>

            </item>

        </purchaseOrder>

        <purchaseOrder/>

        <purchaseOrder>

            <shipTo>

                <export-code>4</export-code>

                <type>EU-Address</type>

                <name>Zou</name>

                <street>47 Eden Street</street>

                <city>Cambridge</city>

                <postcode>126</postcode>

            </shipTo>

        </purchaseOrder>

    </ABC_COMP>

</purchaseOrders>

IBM：

<?xml version="1.0" encoding="UTF-8"?>

<purchaseOrders>

    <IBM_COMP>

        <purchaseOrder/>

        <purchaseOrder>

            <shipTo>

                <export-code>3</export-code>

                <type>US-Address</type>

                <name>Google</name>

                <street>47 Eden Street</street>

                <city>Pal alto</city>

                <postcode>95126</postcode>

            </shipTo>

            <item>

                <partNum>1289-UL</partNum>

                <productName>Jade earring</productName>

                <quantity>5</quantity>

                <price>179.90</price>

                <shipDate>2000-02-14</shipDate>

            </item>

        </purchaseOrder>

        <purchaseOrder/>

    </IBM_COMP>

</purchaseOrders>

要实现这一功能。须要用到的操作有下面几部：

1、创建文档Document类型对象。读入原始文件ipo.xml。

2、找到其根节点，并递归遍历其整个树，而且把实用的信息提取出来。

3、分别输出两个分好类的文件。

具体的代码可以直接看实现过程，里面有非常具体的凝视，看完之后可以对DOM4J主要的处理思路有所了解：

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.OutputStreamWriter;

import java.io.UnsupportedEncodingException;

import java.util.Iterator;

import java.util.List;

import javax.jws.WebParam.Mode;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.DocumentHelper;

import org.dom4j.Element;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;

public class dom4j {

    static String compMode = ""; //静态全局变量。相应按不同公司分类的方式

    /**

     *

     * @param node 原始文件节点，Element类型

     * @param compNode 输出文件节点

     */

    public static void separate(Element node,Element compNode){ //递归遍历函数

        //System.out.println(node.getName());

            List<Attribute> attrList = node.attributes(); //获取节点全部的属性元素

            for (Attribute attr : attrList){

                //System.out.println(attr.getValue());

                if (node.getName().equals("purchaseOrder")){ //要实现的功能是选出属性名为IBM或ABC的purchaseOrder节点

                    if (!attr.getValue().equals(compMode)) return;

                } else {

                    compNode.addElement(attr.getName().toString()); //addElement为加入节点

                    compNode.element(attr.getName().toString()).setText(attr.getValue().toString());//设置子节点的值为当前属性值

                }

            }

        if (!(node.getTextTrim().equals(""))) {

            compNode.setText(node.getText());

        }

        Iterator<Element> it = node.elementIterator();  //迭代器循环获取全部的子节点。并递归调用

        while (it.hasNext()) {

            Element e = it.next();

            //if (node.getName().equals("purchaseOrders")) separate(e,compNode);

        //  if (!node.getName().equals("purchaseOrders")) {

                Element nextCompNode = compNode.addElement(e.getName().toString());

                separate(e,nextCompNode);

            //}

        }

    }

    public static void writer(Document document,String filename) throws Exception{ //输出 xml文件

        OutputFormat format = OutputFormat.createPrettyPrint();

        format.setEncoding("UTF-8");  //设置编码方式

        format.setIndent(true);

        format.setIndent("    ");//设置缩进

        XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(new File(filename)), "UTF-8"), format);

        writer.write(document);  //写入文件

        writer.flush();

        writer.close();

}

    public static void main(String[] args) throws Exception{

        SAXReader reader = new SAXReader(); //使用SAXReader  读入文件结构

        Document  document = reader.read(new File("ipo.xml")); //创建Document对象

        Element node = document.getRootElement(); //获取根节点node

        Document docABC = DocumentHelper.createDocument();

        Document docIBM = DocumentHelper.createDocument();

        Element ABCElement = docABC.addElement("purchaseOrders");

        ABCElement  = ABCElement.addElement("ABC_COMP");

        Element IBMElement = docIBM.addElement("purchaseOrders");

        IBMElement  = IBMElement.addElement("IBM_COMP");

        System.out.println(ABCElement.getName());

        compMode = "ABC";

        separate(node,ABCElement);

        compMode = "IBM";

        separate(node,IBMElement);

        writer(docABC,"ABC_COMP_dom4j.xml");

        writer(docIBM,"IBM_COMP_dom4j.xml");

    }

}

用DOM4J包实现对xml文件按属性分离。的更多相关文章

【JAVA使用XPath、DOM4J解析XML文件，实现对XML文件的CRUD操作】
一.简介 1.使用XPath可以快速精确定位指定的节点,以实现对XML文件的CRUD操作. 2.去网上下载一个“XPath帮助文档”,以便于查看语法等详细信息,最好是那种有很多实例的那种. 3.学习X ...
JDOM方法实现对XML文件的解析
首先要下载JDOM.jar包,下载地址:http://download.csdn.net/detail/ww6055/8880371 下载到JDOM.jar包之后导入到工程中去. 实例程序: book ...
asp.net 实现对xml文件的读取,添加,删除,修改
用于修改站内xml文件已知有一个XML文件(bookstore.xml)如下:<?xml version="1.0" encoding="gb2312" ...
linux下使用libxml2实现对xml文件的读取及查询
由于项目需要,这两天在用C++做XML文件解析的工作.在linux下有个很方便的操作xml文件的库——libxml2,它提供了一套创建和查询xml文件的C语言的接口.这篇博客主要介绍如何使用libxm ...
使用jq的ajax实现对xml文件的读取
之前一直在用json来传递数据,但是xml也是不可缺少的,于是开始了xml的征程.xml的一些属性啊之类的在菜鸟教程上列举的已经很详细了,但是却没有前段部分的获取教程,查询资料,遂懂: index.x ...
Android平台中实现对XML的三种解析方式
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
使用dom4j创建和解析xml文件
使用dom4j创建和解析xml文件在项目开发中,我们经常会遇到xml文件的创建和解析从别人接口得到的xml文件,而我们最常使用的组件是dom4j. 下面我就以代码来讲解一下如何使用dom4j来创建x ...
Java代码加密与反编译（二）：用加密算法DES修改classLoader实现对.class文件加密
Java代码加密与反编译(二):用加密算法DES修改classLoader实现对.class文件加密二.利用加密算法DES实现java代码加密传统的C/C++自动带有保护机制,但java不同,只要 ...
dom4j生成和解析xml文件
dom4j生成和解析xml文件要生成和解析如下格式的xml文件: <?xml version="1.0" encoding="UTF-8"?> & ...

随机推荐

LAN8720A网络模块的使用问题
一.LAN8720A模块驱动电路最近在调试STM32F4驱动LAN8720A网络模块,在做方案前参考是正点原子的LAN8720A的驱动电路方案,但是从网上买回来的LAN8720A模块用正点原子的例程 ...
洛谷 P1610 鸿山洞的灯
P1610 鸿山洞的灯题目描述已知n盏灯以及每盏灯的位置p[i],p[i]均不相等,两盏相邻的灯当小于dist时,若这个安全距离里面还有灯是亮着时,就可以关掉该盏灯,(即若第i-1盏与第i+1盏的 ...
maven的pom.xml配置文件讲解
<project xmlns="http://maven.apache.org/POM/4.0.0 " xmlns:xsi="http://www.w3.o ...
Android底层开发之Linux输入子系统要不要推断系统休眠状态上报键值
Android底层开发之Linux输入子系统要不要推断系统休眠状态上报键值题外话:一个问题研究到最后,那边记录文档的前半部分基本上都是没用的,甚至是错误的. 重点在最后,前边不过一些假想猜測. ht ...
JS实现时钟效果
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
【hdu 2328】Corporate Identity
[链接]h在这里写链接 [题意] 找一个字典序最小的公共最长子串; [题解] 后缀数组. 把所有的串用不同的分隔符分开.(大于'z'的分隔符); 然后求出那几个固定的数组. 二分一下那个子串的长度. ...
【】queue
[链接]点击打开链接 [题意] 实话实说,给 OIER 大神们排队这种工作是最让人头疼的事情了.因为同学们都有自尊心,都不愿意排后面. 现在共有 n 个同学要排成一列,每个同学有两个属性:影响力和承 ...
NLP系列(1)_从破译外星人文字浅谈自然语言处理的基础
作者:龙心尘 &&寒小阳时间:2016年1月. 出处: http://blog.csdn.net/longxinchen_ml/article/details/50543337, h ...
【b091&&z11】潜伏者
Time Limit: 1 second Memory Limit: 128 MB [问题描述] R国和S国正陷入战火之中,双方都互派间谍,潜入对方内部,伺机行动. 历尽艰险后,潜伏于S国的R国间谍小 ...
Fragment的基本应用
转载请注明出处:http://blog.csdn.net/crazy1235/article/details/50933621 Fragment 还是先来基本介绍. Fragment –> 片段 ...

用DOM4J包实现对xml文件按属性分离。

用DOM4J包实现对xml文件按属性分离。的更多相关文章

随机推荐

热门专题