通过w3c方式读取xml内容

/**

     * 通过w3c方式 读取xml内容

     * @param lablenames    要读取的节点名称

     * @param file_path_name 文件绝对路径

     * @return

     */

    public static WebMagic readXML(List<String> lablenames, String file_path_name) {

        WebMagic webMagic = new WebMagic();

        try {

            DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();

            DocumentBuilder builder = factory.newDocumentBuilder();

            org.w3c.dom.Document document = builder.parse(new File(file_path_name));

            org.w3c.dom.Element rootElement = document.getDocumentElement();

            for (int i = 0; i < lablenames.size(); i++) {

                NodeList list = rootElement.getElementsByTagName(lablenames.get(i));

                org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);

                System.out.println(element.getChildNodes().item(0).getNodeValue());

                if ("starturl".equals(element.getNodeName())) {

                    webMagic.setStarturl(element.getChildNodes().item(0)

                            .getNodeValue());

                }

                if ("regexstarturl".equals(element.getNodeName())) {

                    webMagic.setRegexstarturl(element.getChildNodes().item(0)

                            .getNodeValue());

                }

                if ("labelName".equals(element.getNodeName())) {

                    webMagic.setLabelName(element.getChildNodes().item(0)

                            .getNodeValue());

                }

                if ("labeltype".equals(element.getNodeName())) {

                    webMagic.setLabeltype(element.getChildNodes().item(0)

                            .getNodeValue());

                }

                if ("regexdescendants".equals(element.getNodeName())) {

                    webMagic.setRegexdescendants(element.getChildNodes()

                            .item(0).getNodeValue());

                }

            }

        } catch (Exception e) {

            System.out.println("exception:" + e.getMessage());

        }

        return webMagic;

    }

通过w3c方式读取xml内容的更多相关文章

java如果读取xml内容
本文介绍的是使用dom4j方式读取,如需要其他方式可自行百度. 1.首先导入dom4j的jar包:http://www.dom4j.org/dom4j-1.6.1/ 2.准备xml文件 <?xm ...
spring4笔记----UrlResource访问网络资源读取xml内容
package com.ij34.bean; import java.util.Iterator; import java.util.List; import org.dom4j.Document; ...
selenium+Eclipse+testNG读取XML内容登陆系统
package sun; import java.io.File;import org.dom4j.Document;import org.dom4j.DocumentException;import ...
在Spring Boot快捷地读取文件内容的若干种方式
引言: 在Spring Boot构建的项目中,在某些情况下,需要自行去读取项目中的某些文件内容,那该如何以一种轻快简单的方式读取文件内容呢? 基于ApplicationContext读取在Spri ...
Java&Xml教程（二）使用DOM方式解析XML文件
DOM XML 解析方式是最容易理解的,它將XML文件作为Document对象读取到内存中,然后你可以轻松地遍历不同的元素和节点对象.遍历元素和节点不需要按照顺序进行. DOM解析方式适合尺寸较小的X ...
精进 Spring Boot 03：Spring Boot 的配置文件和配置管理，以及用三种方式读取配置文件
精进 Spring Boot 03:Spring Boot 的配置文件和配置管理,以及用三种方式读取配置文件内容简介:本文介绍 Spring Boot 的配置文件和配置管理,以及介绍了三种读取配置文 ...
(转) 读取xml文件转成List<T>对象的两种方法
读取xml文件,是项目中经常要用到的,所以就总结一下,最近项目中用到的读取xml文件并且转成List<T>对象的方法,加上自己知道的另一种实现方法. 就以一个简单的xml做例子. xml格 ...
unity Android 打包后读取 xml 文件
原地址:http://www.cnblogs.com/wuzhang/p/wuzhang20140731.html 问题: 前天在做东西的过程中发现了一个让人很纠结的问题,为什么Unity 程序 ...
jQuery append xmlNode 修改 xml 内容
jQuery append xmlNode 修改 xml 内容 http://blog.darkthread.net/blogs/darkthreadtw/archive/2009/04/29/jqu ...

随机推荐

Hyper-V Tools for win7
http://download.microsoft.com/download/C/1/C/C1CA233D-CA1A-4C4D-8240-B4AFC0FD3433/Windows6.1-KB95883 ...
PHP多线程处理问题
近日工作中涉及到项目同时处理多个线程问题时,在网上找到了PHP的pthreads扩展以及curl_multi_init函数,具体如下: 一 .windows下安装php真正的多线程扩展pthreads ...
MVC中上传文件大小限制的解决办法
在Web.Config文件中配置限制上传文件大小与时间. 需要在配置文件里面设置文件上传限定的两个属性值:maxAllowedContentLength,maxRequestLength 允许上传文件 ...
C# mvc统一通道使用过滤器
问题描述使用C#过滤器有一个最大的问题就是在过滤器转向后程序仍然会执行方法体问题解决思路使用统一通道执行方法不直接进入控制器通过反射调用 using System; using System ...
ucosii任务切换OS_TASK_SW()
stm32F103中任务切换定义 //任务切换宏,由汇编实现. #define OS_TASK_SW() OSCtxSw() os_cpu_a.asm中任务切换函数的定义 NVIC_INT_CTRL ...
javascript 中对象的拷贝
http://blog.csdn.net/i10630226/article/details/52431562 在javascript中,对象都是值引用,也就是说,如果你常规的使用 "=&q ...
前端模块化和AMD、CMD规范
前端模块化和AMD.CMD规范先看下基础:https://github.com/seajs/seajs/issues/547
迁移TFS 2012服务至新的电脑硬件
迁移TFS 2012的时候碰到一些问题, 中文记录很少, 英文的记录也比较零散. 这里记录最直接和简单的方法. 环境: 1. 公司域环境, 所有TFS用户都是公司域帐户. 2. TFS从一台服务器转移 ...
Android 第三方应用广告拦截实现
前段时间,公司制造的机器里应用装有不良广告,严重影响了儿童客户使用者的思想健康.导致被人投诉. 于是乎.就有了想研发一款相似于360广告屏蔽的应用的念头.嗯.事情就是这样.如今切入主题. 眼下市场上有 ...
java序列化，二进制和数据流
类的序列化需要支持Serializable接口,如果类支持序列化,可以通过ObjectOutPutStream和ObjectInputStream将对象和Stream之间进行方便的转换. 首先来看一 ...

通过w3c方式 读取xml内容

通过w3c方式 读取xml内容的更多相关文章

随机推荐

热门专题

通过w3c方式读取xml内容

通过w3c方式读取xml内容的更多相关文章