C# XML解析
摘自:http://www.cnblogs.com/RiseSoft/archive/2012/03/17/2404007.html
之前在项目中处理的都是一些小数据量的XML文件,都是直接用.Net Framework中System.XML命名空间下的基本的XmlDocument、XmlElement、XmlNode等基本类,读取了节点之后, 获取属性及其内部文本内容,但是这种方法在处理小文本量XML数据时,尚可使用,一旦处理较大数据量的XML数据,就显得那么笨拙,效率也低下。
用XPath语言可以方便高效的筛选、获取我们想要的节点、属性等,正如博友所说“XPath语言相对于XML就如同SQL语言相对于DataBase”,这里也给大家分享下:
1.这里我参照MSDN给出一个XML源文件,为了显示不同的效果,XML结构在逻辑上并不合理

1 <?xml version="1.0" encoding="utf-8" ?>
2 <bookstore>
3 <book>
4 <title>C语言</title>
5 <author name ="XIAO">
6 <age>25</age>
7 </author>
8 <price>50</price>
9 </book>
10 <book>
11 <title>数据库</title>
12 <price>100</price >
13 </book >
14 <book>
15 <title>数据结构</title>
16 <age>100</age>
17 <author name ="Wang">
18 <age>25</age>
19 <sex>female</sex>
20 </author>
21 <price>66.5</price >
22 </book >
23 </bookstore>

2.简单示例

1 private void button1_Click(object sender, EventArgs e)
2 {
3 XmlDocument doc = new XmlDocument();
4 doc.Load(@"..\..\CD.xml");
5
6 XmlElement root = null;
7 root = doc.DocumentElement;
8
9 XmlNodeList listNodes = null;
10 listNodes = root.SelectNodes("/bookstore/book/price");
11 foreach (XmlNode node in listNodes )
12 {
13 richTextBox1.Text += node.InnerText + "\n";
14 }
15 }

这里 listNodes=root.SelectNodes("/bookstore/book/price");意思是选取所有符合bookstore——>book——>price层级关系的price节点
效果如下图:
3.XPath详解
1)"/bookstore/book/price"
XPath的开头是一个斜线(/)代表这是绝对路径,这可以选出所有路径符合这个模式的元素。这代表选出所有bookstore根节点下的book元素下的price元素。
2)"//title"
开头是两个斜线(//)表示文件中所有符合模式的元素都会被选出来,即使是处于树中不同的层级也会被选出来。这代表选出所有title元素。
3)"/bookstore/book/author/*"
使用星号(*)可以选择未知的元素。这代表选出bookstore根节点下的book节点下的anthor节点下的所有可能的节点。
得到的结果:25 25 female
4)"/bookstore/book/*/age"
上面的语法会选出所有bookstore根节点下的book节点的隔一个层次的age节点。
得到的结果为:25 25
5)"/*/*/age"
选取有两个层级的age元素,得到的结果为:100
要注意的是,想要存取不分层级的元素,XPath语法必须以两个斜线开头(//),想要存取未知元素才用星号(*),星号只能代表未知名称的元素,不能代表未知层级的元素。
6)"bookstore/book[1]/title"
使用中括号可以选择分支。这代表选择bookstore根节点下第一个book节点的title节点。
得到的结果为:C语言
7)"bookstore/book[last()]/title"
同样,这里表示选择最后一个节点,得到的结果是:数据结构
8)"bookstore/book/author[sex]"
这里表示选取所有带有sex元素并满足一定层次结构的author节点,得到的结果是:25female
9)"/bookstore/book[price=66.5]/title"
选取price元素值是66.5的book节点的title子节点,得到的结果是:数据结构
10)"/bookstore/book/title | /bookstore/book/price"
使用Or操作数(|)就可以选择一个以上的路径。这里表示选取符合一定层次结构的title元素与price元素
其结果是:C语言 50 数据库 100 数据结构 66.5
11)"//@name"
在XPath中,除了选择元素以外,也可以选择属性,属性都是以@开头。这里表示选取所有的name属性。
其结果是:XIAO Wang
12)"//author[@name]/age"
这里表示选取所有具有name属性的author节点的age节点。其结果是:25 25
13)"//*[@*]"
选取所有有属性的节点。其结果是:25 25female
14)"//author[@name='Wang']/sex"
选取所有属性name值为Wang的author节点的sex子节点。其结果是:female
4.带有命名空间(NameSpace)的XML文本解析
XML文本:

1 <?xml version="1.0" encoding="utf-8" ?>
2 <bookstore xmlns="http://www.lucernepublishing.com"
3 xml:base="http://www.semanticweb.org/ontologies/2012/2/OntologyMinePower.owl">
4 <book>
5 <title>C语言</title>
6 <author name ="XIAO">
7 <age>25</age>
8 </author>
9 <price>50</price>
10 </book>
11 <book>
12 <title>数据库</title>
13 <price>100</price >
14 </book >
15 <book>
16 <title>数据结构</title>
17 <age>100</age>
18 <author name ="Wang">
19 <age>25</age>
20 <sex>female</sex>
21 </author>
22 <price>66.5</price >
23 </book >
24 </bookstore>

解析:

1 private void button1_Click(object sender, EventArgs e)
2 {
3 XmlDocument doc = new XmlDocument();
4 doc.Load(@"..\..\CD.xml");
5
6 XmlElement root = null;
7 root = doc.DocumentElement;
8
9 XmlNamespaceManager nsmgr = new XmlNamespaceManager(doc.NameTable);
10 nsmgr.AddNamespace("ab", "http://www.lucernepublishing.com");
11
12 XmlNodeList listNodes = null;
13 listNodes = doc.SelectNodes("/ab:bookstore/ab:book[ab:author[ab:sex]]/ab:price", nsmgr);
14 foreach (XmlNode node in listNodes )
15 {
16 richTextBox1.Text += node.InnerText + "\n";
17 }
18 }

该XPath语言的意思是查询bookstore下的所有带有author节点,并且author节点带有sex节点的book节点的price子节点。其结果是66.5
对于有命名空间的XML文本的解析,只需调用XmlNode.SelectNodes的不同的重载函数,赋予XmlNamespaceManager参数,并相应调整XPath语句即可。
文章参考:
MSDN中XmlNode.SelectNodes 方法;
W3CSchool在线帮助XPath;
http://www.cnblogs.com/hya1109/archive/2007/12/16/996535.html
C# XML解析的更多相关文章
- xml解析技术
本文总结Dom,sax解析, 使用Java作为工具解析xml文档. 1 Dom 综述:Dom解析xml通常也称为xmlDom (和htmlDom技术差不多),将xml文档封装成树,好处就是xml中的 ...
- Duilib源码分析(三)XML解析器—CMarkup
上一节介绍了控件构造器CDialogBuilder,接下来将分析其XML解析器CMarkup: CMarkup:xml解析器,目前内置支持三种编码格式:UTF8.UNICODE.ASNI,默认为UTF ...
- JSON解析和XML解析对比
JSON解析和XML解析是较为普遍的两种解析方式,其中JSON解析的市场分额更大.本文系统的分析两种解析方式的区别,为更好地处理数据作准备.由于目前阶段主要是做移动开发,所以本文所描述的JSON解析和 ...
- 【Android】实现XML解析的几种技术
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
- 定位和xml解析和gson解析加上拉加载,下拉刷新
这里的上拉加载,下拉刷新用到是依赖包 Mainactivity,xml解析和定位 package com.exmple.autolayout; import java.util.List; impor ...
- tinyxml一个优秀的C++ XML解析器
读取和设置xml配置文件是最常用的操作,试用了几个C++的XML解析器,个人感觉TinyXML是使用起来最舒服的,因为它的API接口和Java的十分类似,面向对象性很好. TinyXML是一个开源的解 ...
- PERL/LEX/YACC技术实现文本解析--XML解析
继周六的p_enum.pl后,再来一篇说说我用perl做的lex,yacc工具.之前说了,我学习lex和yacc的最初动机是为了做个C语言解释器的SHELL:但后来工作中的实际需要也是制作perl版l ...
- 基本XML解析---编写
#import "ViewController.h" #import "DDXML.h" @interface ViewController () @end @ ...
- iOS-数据解析XML解析的多种平台介绍
在iPhone开发中,XML的解析有很多选择,iOS SDK提供了NSXMLParser和libxml2两个类库,另外还有很多第三方类库可选,例如TBXML.TouchXML.KissXML.Tiny ...
- XML解析之DOM详解及与SAX解析方法的比较
XML解析(DOM) XML文件解析方法介绍 我们所用到的NSXMLParser是采用SAX方法解析 SAX(Simple API for XML) 只能读,不能修改,只能顺序访问,适合解析大型XML ...
随机推荐
- Vue中vue.config的配置
vue-cli 3.x 脚手架搭建完成后,项目目录中没有 vue.config.js 文件,需要手动在根目录中创建 vue.config.js. vue.config.js 是一个可选的配置文件,如果 ...
- Oracle sqlplus中退格键、DEL键、上下左右键无法使用乱码问题
功能描述:Oracle sqlplus中退格键.DEL键.上下左右键无法使用乱码 1.安装readline-8.0 ①下载readline-8.0.tar.gz文件,百度网盘下载路径: https:/ ...
- 一道JavaScript的二维数组求平均数的题
JavaScript中只支持一维数组,但是可以在数组中嵌套数组来创建二维以至于多维的数组.今天下午在看书时候,发现一道感觉比较有意思的题,就是js中如何求二维数组的列之和和行之和,现在就给大家分享下, ...
- Linux下rm操作误删恢复
1.查看被误删的分区 df /home/Java/... 一直到刚刚被误删的文件的路径下 2.在debugfs打开分区 open /dev/ssl 最好这个分区可能不一样,根据上 ...
- rocketmq-console修改logo,修改ip,修改port及完整编译安装图文版
一.下载源码到本地 这里使用IDEA,作为编译工具 https://gitee.com/mrliuNumberOne/rocketmq-externals.git 导入成功后如图: 二.Maven编译 ...
- golang "%p"学习记录随笔
对于获取slice的指针地址, 通过unsafe.Pointer 和 "%p"占位符两种方式得到的地址是不同的 s := make([]int, 1) t.Log(unsafe.P ...
- Shell学习(五)Shell输出命令
一.echo命令 #1.直接显示字符串 echo "It is a test" #输出:It is a test #2.显示转义字符 echo "\"It is ...
- 使用 mysqld_safe 启动 mysqld 服务
目录 mysqld_safe 介绍 启动 停止 mysqld_safe 介绍 mysqld_safe is the recommended way to start a mysqld server o ...
- # js权威指南之对象篇
对象是js中的关键 属性查找 in,Object.hasOwnProperty(),Object.propertyIsEnumerable()都能检测出对象内是否存在某个属性 in关键字 自有属性/继 ...
- 030 01 Android 零基础入门 01 Java基础语法 03 Java运算符 10 条件运算符
030 01 Android 零基础入门 01 Java基础语法 03 Java运算符 10 条件运算符 本文知识点:Java中的条件运算符 条件运算符是Java当中唯一一个三目运算符 什么是三目运算 ...