XPath简介

XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言。

XPath基于XML的树状结构，提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言。

XPath基本表达式

表达式	描述
nodename	选取此节点的所有子节点。
/	从根节点选取。
//	从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
.	选取当前节点。
..	选取当前节点的父节点。
@	选取属性。

XPath基本表达式案例

路径表达式	结果
bookstore	选取 bookstore 元素的所有子节点。
/bookstore	选取根元素 bookstore。注释：假如路径起始于正斜杠( / )，则此路径始终代表到某元素的绝对路径！
bookstore/book	选取属于 bookstore 的子元素的所有 book 元素。
//book	选取所有 book 子元素，而不管它们在文档中的位置。
bookstore//book	选择属于 bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置。
//@lang	选取名为 lang 的所有属性。

XPath谓语表达式

路径表达式	结果
/bookstore/book[1]	选取属于bookstore子元素的第一个book元素
/bookstore/book[late()]	选取属于bookstore子元素的最后一个book元素
/bookstore/book[late()-1]	选取属于bookstore子元素的倒数第二个book元素
/bookstore/book[position()<3]	选取最前面的两个属于bookstore元素的子元素的book元素
//title[@lang]	选取所有拥有名为lang的属性的title元素
//title[@lang='eng']	选取所有title元素，且这些元素拥有值为eng的lang属性
/bookstore/book[price>35.00]	选取bookstore元素的所有book元素，且其中的price元素的值须大于35.00
/bookstore/book[price>35.00]/title	选取bookstore元素的book元素的所有title元素，且其中的price元素的值须大于35.00

Dom4j底层依赖Jaxen实现XPath查询

Jaxen介绍

Jaxen是一个Java编写的开源的XPath库。这里适应多种不同的对象模型，包括DOM，XOM，dom4j和JDOM。
Dom4j底层依赖Jaxen实现XPath查询
Jaxen下载地址：jaxen.codehaus.org，因为是外网，所以一般从阿里云仓库下载

XPath查询

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.Node;

import org.dom4j.io.SAXReader;

public class XPathTestor {

	public void xpath(String xpathExp){

		String file = "E:/workspace/eclipse/HelloWorld/src/test2/hr.xml";

		SAXReader reader = new SAXReader();

		try {

			Document document = reader.read(file);

			List<Node> nodes = document.selectNodes(xpathExp);//解析xpath表达式

			for(Node node : nodes){

				Element emp = (Element)node;

				System.out.println(emp.attributeValue("no"));

				System.out.println(emp.elementText("name"));

				System.out.println(emp.elementText("age"));

				System.out.println(emp.elementText("salary"));

				System.out.println("==============================");

			}

		} catch (DocumentException e) {

			e.printStackTrace();

		}

	}

	public static void main(String[] args) {

		XPathTestor testor = new XPathTestor();

//		testor.xpath("/hr/employee");//

//		testor.xpath("//employee");

//		testor.xpath("//employee[salary<4000]");

//		testor.xpath("//employee[name='李铁柱']");

//		testor.xpath("//employee[@no=3304]");

//		testor.xpath("//employee[1]");

//		testor.xpath("//employee[last()]");

		//testor.xpath("//employee[position()<3]");

		testor.xpath("//employee[3] | //employee[8]");

	}

}

总结

在编写XML应用的时候，一旦涉及到查询操作优先使用XPath表达式。

参考文献：

https://baike.baidu.com/item/XPath/5574064

【XML】XPath表达式的更多相关文章

JavaEE XML XPath
JavaEE XML XPath @author ixenos XPath技术 1 引入问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!需要遍历DOM树的众多节点 ...
HTML/XML/XPATH基础
Html超文本标记语言网页上单击右键→查看源文件/查看源代码 Html基本结构 <html> 为文档根元素,所有元素都在内部进行 <head> ...
xml xpath dta笔记
xml: 有且只有一个根元素默认utf-8 如果是中文且为不是utf-8的必须指定编码声明的编码必须和文档的内容保持一致 well-formed XML :是否符合xml语法 valid xml: ...
Java xml 操作(Dom4J修改xml + xPath技术 + SAX解析 + XML约束)
1 XML基础 1)XML的作用 1.1 作为软件配置文件 1.2 作为小型的"数据库" 2)XML语法(由w3c组织规定的) 标签: 标签名不能以数字开头,中间不能有空格,区分大 ...
网络爬虫之Selenium模块和Xpath表达式+Lxml解析库的使用
实际生产环境下,我们一般使用lxml的xpath来解析出我们想要的数据,本篇博客将重点整理Selenium和Xpath表达式,关于CSS选择器,将另外再整理一篇! 一.介绍: selenium最初是一 ...
【Selenium】HTML/XML/XPATH基础
Html超文本标记语言网页上单击右键→查看源文件/查看源代码 Html基本结构 <html> 为文档根元素,所有元素都在内部进行 <head> ...
Xpath表达式的粗介绍
关于在自动化中Xpath表达式的书写,其实我也只是刚刚入门,粗略的跟着网上的教程学了一下,这篇我就来分享总结一下我学习到的知识. 首先呢,我们先认识一下什么是Xpath.Xpath是XML路径语言,它 ...
第三百三十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式
第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式我们自定义一个main.py来作为启动文件 main.py #!/usr/bin/en ...
第三百三十六节，web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础
第三百三十六节,web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础在urllib中,我们一样可以使用xpath表达式进行信息提取,此时,你需要首先安装lxml模块 ...

随机推荐

Python语法易错点
列表.数组赋值 a = [1,6] b = a * 2 b[0] = -9999 print(a) print(b) [1, 6] [-9999, 6, 1, 6] a = [1,6] b = a b ...
Eclipse中Junit测试中@Before不执行
场景在使用Junit进行单元测试时,一部分获取JPA的entityManager的代码将其放在了 @Before标注的方法中,这样每次执行@TEST标注的方法时会首先执行@Before标注的方法. ...
创建线程之三：实现Callable接口
通过Callable和Future创建线程 i. 创建Callable接口的实现类,并实现call方法,该call方法将作为线程执行体,并且有返回值,可以抛出异常. ii. 创建Callable实现类 ...
Gradle之FTP文件下载
Gradle之FTP文件下载 1.背景项目上需要使用本地web,所以我们直接将web直接放入assets资源文件夹下.但是随着开发进行web包越来越大:所以我们想着从版本库里面去掉web将其忽略掉, ...
读书笔记_python网络编程3(5)
5. 网络数据与网络错误应该如何准备需要传输的数据? 应该如何对数据进行编码与格式化? Py程序需要提供哪些类型的错误? 5.1. 字节与字符串 PC与网卡都支持将字节作为通用传输单元.字节将8比特 ...
文件操作NIO
在丑陋的 Java I/O 编程方式诞生多年以后,Java终于简化了文件读写的基本操作. 两个基本组件文件或者目录的路径: 文件本身. 这块基本都是些记忆性的东西,没什么过多的需要写的地方,用的时候 ...
Node.js接口避免重复启动
众所周知,一个Node接口要是想被调用,得先在命令行中执行如下代码来启动接口 node base.js 但是一旦修改了base.js,就得重新执行这句命令注:这里的base.js是我的node接口文 ...
二、ITK例子-jpg图像读写
一.ITK的读写工作原理在ITK里面,我们需要设置读取图像的像素类型,图像类型. 然后设置读取指针,将读取参数传入. 同时设置写指针,也将写入文件参数传入. 为了实现读写动作,我们需要构造一个IO工 ...
【转】C++ - 结构体构造函数使用总结
声明转载自:https://www.cnblogs.com/wlw-x/p/11566191.html 关于结构体构造函数使用总结三种结构体初始化方法 1.利用结构体自带的默认构造函数 2.利用带 ...
cf之kmp匹配稍稍改一改
看样例就知道要干嘛了 http://codeforces.com/contest/1200/problem/E 每次我们用新的串和答案串匹配,答案串的匹配位置是max(0,(int)ans.size( ...

【XML】XPath表达式

XPath简介

XPath基本表达式

XPath基本表达式案例

XPath谓语表达式

Dom4j底层依赖Jaxen实现XPath查询

Jaxen介绍

XPath查询

总结

【XML】XPath表达式的更多相关文章

随机推荐

热门专题