原文 http://www.cnblogs.com/mgen/archive/2012/04/26/2471403.html

XmlReader默认是读取XML文件中的Whitespace和注释的。

比如这个XML:

<root>

<!-- root中 -->

<file>

<file.attr>hidden</file.attr>

a.txt

</file>

</root>

XmlReader读取代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

while (xr.Read())

Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);

}

将会输出:

NodeType:XmlDeclaration       Name:xml

NodeType:Whitespace           Name:

NodeType:Element              Name:root

NodeType:Whitespace           Name:

NodeType:Comment              Name:

NodeType:Whitespace           Name:

NodeType:Element              Name:file

NodeType:Whitespace           Name:

NodeType:Element              Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file

NodeType:Whitespace           Name:

NodeType:EndElement           Name:root

可以看到,Whitespace和注释都被读了进来。

解决方案之一就是在XmlReaderSettings中将IgnoreWhitespace和IgnoreComments设置为True(默认当然是False),然后再创建XmlReader:

var xrs =newXmlReaderSettings();

xrs.IgnoreComments =true;

xrs.IgnoreWhitespace =true;

using (var xr =XmlReader.Create("data.xml", xrs))

{ }

还可以使用XmlReader的MoveToContent方法,可以参考MSDN的全面解释(http://msdn.microsoft.com/zh-cn/library/system.xml.xmlreader.movetocontent.aspx):

检查当前节点是否是内容(非空白文本、CDATA、Element、EndElement、EntityReference 或 EndEntity)节点。 如果此节点不是内容节点,则读取器向前跳至下一个内容节点或文件结尾。 它跳过以下类型的节点:ProcessingInstruction、DocumentType、Comment、Whitespace 或 SignificantWhitespace。

代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

while (xr.Read())

{

xr.MoveToContent();

Console.WriteLine("NodeType:{0,-20} Name:{1}", xr.NodeType, xr.Name);

}

}

输出:

NodeType:Element              Name:root

NodeType:Element              Name:file

NodeType:Element              Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file.attr

NodeType:Text                 Name:

NodeType:EndElement           Name:file

NodeType:EndElement           Name:root

Whitespace和注释都没了。

注意不要和XmlReader的两个其他的方法混淆:MoveToAttribute和MoveToElement,这两个是在XML元素和属性之间的移动。

另外许多XmlReader的读取操作内部会调用MoveToContent方法,比如ReadElementString,ReadStartElement,ReadEndElement……

第三个要说的方法是MoveToFollowing方法,这个方法会一直读下去直到指定名称的元素被找到。这样的话我们直接去找需要的节点而直接省略那些Whitespace或者注释。

代码:

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

//使用ReadToFollowing读至file.attr元素

xr.ReadToFollowing("file.attr");

Console.WriteLine(xr.ReadElementString());

//读取元素内的XML文本

Console.WriteLine(xr.ReadString().Trim());

}

输出:

hidden

a.txt

注意XML元素内的文字节点的Whitespace是始终保留的。

.NET(C#):XmlReader和Whitespace以及MoveToContent和ReadToFollowing方法的更多相关文章

  1. 深入认识XmlReader

      深入认识XmlReader 摘要 XmlReader类是组成.NET的关键技术之一,极大地方便了开发人员对Xml的操作.通过本文您将对XmlReader有一个很好的认识,并将其应用到实际开发中. ...

  2. 认识XmlReader

    认识XmlReader   摘要 XmlReader类是组成.NET的关键技术之一,极大地方便了开发人员对Xml的操作.通过本文您将对XmlReader有一个很好的认识,并将其应用到实际开发中. 目录 ...

  3. XmlReader读取XML

    StringBuilder output = new StringBuilder(); String xmlString = @"<bookstore> <book gen ...

  4. 初探Net框架下的XML编程技术

    一.前言: XML是微软.Net战略的一个重要组成部分,而且它可谓是XML Web服务的基石,所以掌握.Net框架下的XML技术自然显得非常重要了.本文将指导大家如何运用C#语言完成.Net框架下的X ...

  5. .NET下XML文件的读写

    一.前言: XML是微软.Net战略的一个重要组成部分,而且它可谓是XML Web服务的基石,所以掌握.Net框架下的XML技术自然显得非常重要了.本文将指导大家如何运用C#语言完成.Net框架下的X ...

  6. Linq世界走一走(LINQ TO XML)

    前言:Linq to xml是一种使用XML的新方法.从本质上来说,它采用了多种当前使用的XML处理技术,如DOM和XPath,并直接在.NET Framework内将它们组合为一个单一的编程接口.L ...

  7. Project Web Server PSI 接口一些常用操作

    对Project Web Server进行二次开发,每天都把自己折腾到12点以后才休息,到处都是坑,研究那些烦人的PSI,国内根本查不到PSI相关的资料,对照API文档一点点谷歌资料,全部英文资料,开 ...

  8. git diff ^M的消除

    这是由于换行符在不同的操作系统上定义的区别造成的. Windows用CR LF来定义换行,Linux用LF. CR全称是Carriage Return ,或者表示为\r, 意思是回车. LF全称是Li ...

  9. 【转】 Android 开发 之 JNI入门 - NDK从入门到精通

    原文网址:http://blog.csdn.net/shulianghan/article/details/18964835 NDK项目源码地址 : -- 第一个JNI示例程序下载 : GitHub  ...

随机推荐

  1. 第八章: IO库

    一.IO类 1.iostream定义了读写流的基本类型,fstream定义了读写命名文件的类型,sstream定义了读写内存string对象的类型 2.不能拷贝IO对象,因此不能将形参或返回类型设置为 ...

  2. leetcode Linked List Cycle II python

    # Definition for singly-linked list. # class ListNode(object): # def __init__(self, x): # self.val = ...

  3. C#控件、窗体置顶

    //控件置于顶层和底层 panel.BringToFront();//置于顶层 panel.SendToBack();//置于底层 //窗体置顶 TopMost = true;

  4. SQL Server MySQL 中的 in 与 null

    例子: create table t(x int,y int); insert into t(x,y) values(1,1),(2,2),(null,null); 查询一: select x,y f ...

  5. 在非gui线程使用QMessageBox

    最近我写项目的时候遇到一个奇怪的需求,要在工作线程内,根据某个情况弹出一个MessageBox 但是Qt提供的MessageBox只可以在gui线程(主线程)使用,于是我就对QMessageBox封装 ...

  6. windows的命令行工具和DOS工具的区别

    很多的系统管理员可能认为命令行是程序员编程用的,这是不对的,其实命令行是另一种用来管理计算机的接口.1 命令行窗口        Windows NT/Windows 2000以后的操作系统为用户提供 ...

  7. 2014年同年CFA考试中哪些CFA资料没有变化?

    从2014年起,美国CFA协会将官方教材.题库.模拟题等CFA资料捆绑在报名费用之中,而以往可以单独选购的纸质版教材也变成了额外购买.这让非常多參加12月的CFA考生产生了借阅6月考生CFA资料的想法 ...

  8. Spoken English

    The Business lunch 9.商务午餐怎样开场?[0731] Is this your first time in shanghai? 10.怎样询问对方的感受?[0801] How do ...

  9. jquery常用语句总结

    一.jquery中text val html attr的使用区别 html和innerHTMl是一样的,可以获得和设置指定元素如<p>中的html标签和文本如:设置值: $("p ...

  10. COM组件简介

    面向对象的思想难以适应这种分布式软件模型,于是组件化程序设计思想得到了迅速的发展. 按照组件化的程序设计的思想,复杂的应用程序被设计成一些小的,功能单一的组件模块,这些组件模块可以运行在同一台机器上, ...