.NET(C#):XmlReader和Whitespace以及MoveToContent和ReadToFollowing方法
原文 http://www.cnblogs.com/mgen/archive/2012/04/26/2471403.html
XmlReader默认是读取XML文件中的Whitespace和注释的。
比如这个XML:
<root>
<!-- root中 -->
<file>
<file.attr>hidden</file.attr>
a.txt
</file>
</root>
XmlReader读取代码:
//data.xml代表上面的XML文件
using (var xr =XmlReader.Create("data.xml"))
{
while (xr.Read())
Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);
}
将会输出:
NodeType:XmlDeclaration Name:xml
NodeType:Whitespace Name:
NodeType:Element Name:root
NodeType:Whitespace Name:
NodeType:Comment Name:
NodeType:Whitespace Name:
NodeType:Element Name:file
NodeType:Whitespace Name:
NodeType:Element Name:file.attr
NodeType:Text Name:
NodeType:EndElement Name:file.attr
NodeType:Text Name:
NodeType:EndElement Name:file
NodeType:Whitespace Name:
NodeType:EndElement Name:root
可以看到,Whitespace和注释都被读了进来。
解决方案之一就是在XmlReaderSettings中将IgnoreWhitespace和IgnoreComments设置为True(默认当然是False),然后再创建XmlReader:
var xrs =newXmlReaderSettings();
xrs.IgnoreComments =true;
xrs.IgnoreWhitespace =true;
using (var xr =XmlReader.Create("data.xml", xrs))
{ }
还可以使用XmlReader的MoveToContent方法,可以参考MSDN的全面解释(http://msdn.microsoft.com/zh-cn/library/system.xml.xmlreader.movetocontent.aspx):
检查当前节点是否是内容(非空白文本、CDATA、Element、EndElement、EntityReference 或 EndEntity)节点。 如果此节点不是内容节点,则读取器向前跳至下一个内容节点或文件结尾。 它跳过以下类型的节点:ProcessingInstruction、DocumentType、Comment、Whitespace 或 SignificantWhitespace。
代码:
//data.xml代表上面的XML文件
using (var xr =XmlReader.Create("data.xml"))
{
while (xr.Read())
{
xr.MoveToContent();
Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);
}
}
输出:
NodeType:Element Name:root
NodeType:Element Name:file
NodeType:Element Name:file.attr
NodeType:Text Name:
NodeType:EndElement Name:file.attr
NodeType:Text Name:
NodeType:EndElement Name:file
NodeType:EndElement Name:root
Whitespace和注释都没了。
注意不要和XmlReader的两个其他的方法混淆:MoveToAttribute和MoveToElement,这两个是在XML元素和属性之间的移动。
另外许多XmlReader的读取操作内部会调用MoveToContent方法,比如ReadElementString,ReadStartElement,ReadEndElement……
第三个要说的方法是MoveToFollowing方法,这个方法会一直读下去直到指定名称的元素被找到。这样的话我们直接去找需要的节点而直接省略那些Whitespace或者注释。
代码:
//data.xml代表上面的XML文件
using (var xr =XmlReader.Create("data.xml"))
{
//使用ReadToFollowing读至file.attr元素
xr.ReadToFollowing("file.attr");
Console.WriteLine(xr.ReadElementString());
//读取元素内的XML文本
Console.WriteLine(xr.ReadString().Trim());
}
输出:
hidden
a.txt
注意XML元素内的文字节点的Whitespace是始终保留的。
.NET(C#):XmlReader和Whitespace以及MoveToContent和ReadToFollowing方法的更多相关文章
- 深入认识XmlReader
深入认识XmlReader 摘要 XmlReader类是组成.NET的关键技术之一,极大地方便了开发人员对Xml的操作.通过本文您将对XmlReader有一个很好的认识,并将其应用到实际开发中. ...
- 认识XmlReader
认识XmlReader 摘要 XmlReader类是组成.NET的关键技术之一,极大地方便了开发人员对Xml的操作.通过本文您将对XmlReader有一个很好的认识,并将其应用到实际开发中. 目录 ...
- XmlReader读取XML
StringBuilder output = new StringBuilder(); String xmlString = @"<bookstore> <book gen ...
- 初探Net框架下的XML编程技术
一.前言: XML是微软.Net战略的一个重要组成部分,而且它可谓是XML Web服务的基石,所以掌握.Net框架下的XML技术自然显得非常重要了.本文将指导大家如何运用C#语言完成.Net框架下的X ...
- .NET下XML文件的读写
一.前言: XML是微软.Net战略的一个重要组成部分,而且它可谓是XML Web服务的基石,所以掌握.Net框架下的XML技术自然显得非常重要了.本文将指导大家如何运用C#语言完成.Net框架下的X ...
- Linq世界走一走(LINQ TO XML)
前言:Linq to xml是一种使用XML的新方法.从本质上来说,它采用了多种当前使用的XML处理技术,如DOM和XPath,并直接在.NET Framework内将它们组合为一个单一的编程接口.L ...
- Project Web Server PSI 接口一些常用操作
对Project Web Server进行二次开发,每天都把自己折腾到12点以后才休息,到处都是坑,研究那些烦人的PSI,国内根本查不到PSI相关的资料,对照API文档一点点谷歌资料,全部英文资料,开 ...
- git diff ^M的消除
这是由于换行符在不同的操作系统上定义的区别造成的. Windows用CR LF来定义换行,Linux用LF. CR全称是Carriage Return ,或者表示为\r, 意思是回车. LF全称是Li ...
- 【转】 Android 开发 之 JNI入门 - NDK从入门到精通
原文网址:http://blog.csdn.net/shulianghan/article/details/18964835 NDK项目源码地址 : -- 第一个JNI示例程序下载 : GitHub ...
随机推荐
- House Robber & House Robber II
You are a professional robber planning to rob houses along a street. Each house has a certain amount ...
- leetcode First Missing Positive python
class Solution(object): def firstMissingPositive(self, nums): """ :type nums: List[in ...
- Hive进阶(上)
Hive进阶(上) Hive进阶(上) 执行数据导入 使用Load语句 语法: 1.LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE ...
- java中输出流OutputStream 类应用实例(转)
OutputStream类该类是字节输出流的抽象类,定义了输出流的各种操作方法.这些方法的说明如表1所示.下面通过实例介绍如何使用OutputStream类向控制台输出字符串信息.步骤如下.(1)创建 ...
- MongoDB Error
①,org.springframework.core.convert.ConverterNotFoundException: No converter found capable of con ...
- Cocos2d-x 3.1.1 学习日志6--30分钟了解C++11新特性
新的keyword auto C++11中引入auto第一种作用是为了自己主动类型推导 auto的自己主动类型推导,用于从初始化表达式中判断出变量的数据类型.通过auto的自己主动类型推导.能够大大简 ...
- EasyUI中datagrid实现显示、增加、 删除、 修改、 查询操作(后台代码C#)
菜鸟进入,高手请绕道! +++++++++++++++++++++++++++++++++++++++ 一.数据的显示 1新建HtmlPage2.html页面,引入相关文件.如下所示 <scri ...
- asp.net软件测试学习
ormaping类是,将数据操作封装起来的一种数据操作方法,在测试的时候,如果说,insert之后对obj对象赋值赋值,每个属性应该对应自己的objDataRow["REGISTERID&q ...
- 权威指南之脚本化http
使用javascript代码操作http是可行的.当用脚本设置window对象的location属性或调用表单对象的submit方法时,都会初始化http请求.这两种情况下,浏览器会加载新页面. aj ...
- NET项目反编译+VS解决方案整理流程
net项目反编译 工具:De4Dot + IL SPY和Reflector结合使用 项目:vs10+创建解决方案,每个类库尽量按照dll名来命名,方便整合,新建web项目先把aspx等文件拷贝进去,注 ...