XML解析中的namespace初探

初学者在解析XML文件的时候最容易遇到的问题恐怕就是XML的namespace了，本文旨在对namespace做一个简要的介绍。

namespace的意义无需多说，和C++，C#等高级语言一样，XML同样面临大量文件放在一起的时候变量重名的问题，所以要用namespace把名字相同意义不同的变量隔离开。本文着重讨论namespace的解析方法。

以下是一个简单的XML文件:

<root>

<child id = ‘0’>

hello world

</child>

<child id='1'>

one

</child>

</root>

这个例子里面没有namespace，大家初学XML时接触的例子恐怕都是这样的。这种例子具有误导性，初学者解析出了hello world之后就兴高采烈的拿同样的程序去解析实际的XML文件，往往铩羽而归。下面是一段豆瓣API返回的XML文件

<?xml version="1.0" encoding="UTF-8"?>
<entry xmlns="http://www.w3.org/2005/Atom" xmlns:db="http://www.douban.com/xmlns/" xmlns:gd="http://schemas.google.com/g/2005" xmlns:opensearch="http://a9.com/-/spec/opensearchrss/1.0/">
<id>http://api.douban.com/event/10069638</id>
<title>Debugging the Web </title>
<category scheme="http://www.douban.com/2007#kind" term="http://www.douban.com/2007#event.salon"/>
<author>
    <link href="http://api.douban.com/people/1057620" rel="self"/>
    <link href="http://www.douban.com/people/aka/" rel="alternate"/>
    <link href="http://t.douban.com/icon/u1057620-16.jpg" rel="icon"/>

name>胖胖的大头鱼</name>
    <uri>http://api.douban.com/people/1057620</uri>
</author>

<db:attribute name="invite_only">no</db:attribute>

看到这么多www就不想看直接跳过，然后看到熟悉的<author> </author>, 果断套用上面例子的程序，一运行却啥都得不到，问题到底出在哪？C#提供一大堆的XML类，XDocument, XReader, XPath, XmlDocument，是不是我现在用的这种类不给力啊，没法确定只好乱试，一乱试一晚上就过去了。童鞋，我们还是静下心来逐行看看吧。

<?xml version="1.0" encoding="UTF-8"?>这行没看头，看下面这里<entry xmlns="http://www.w3.org/2005/Atom" ，xmlns就是xml namespace的意思，这坑爹的http://www.w3.org/2005/Atom到底是个啥呢。再往后看，xmlns:db="http://www.douban.com/xmlns/" ，结合<db:attribute name="invite_only">no</db:attribute>这句话，可以理解了，db是一个namespace的简称，方便写在元素的名字前面，这样<db:attribute> 和 <attribute>, <gd:attribute>就不一样了。这种简称可以在一个文档里面区别变量，但是对大量的文档还是不行，所以namespace还有一个全称，就是这里的http://www.douban.com/xmlns/。这个全称其实写什么内容都行，对XML Parser来说都是当做字符串来处理的，但一来想名字比较麻烦，二来可以顺道做个广告，所以大家一般都用的网址。Parse的时候Parser根据全称来区别变量，所以就算两个文档中都有<db:attribute>，只要全称不一样，都没有问题。

这么说就比较清楚了，但那个http://www.w3.org/2005/Atom到底是个啥啊，连个简称都没有。哎，意识到这个就对了，他的简称就是””,空串。这东西被称为default namespace，那些看上去没有前缀的都是在这个namespace下的。所以那个<author>不是裸的啊，人家其实是 <”http://www.w3.org/2005/Atom” ： author> 所以裸的程序当然是解析不了的了。

那么该如何解析呢？这里提供一个样例程序，希望对大家有帮助。这个代码可以在WP7上运行。我还有一个版本用的XmlDocument，尼玛WP7上木有这个类，坑爹的。。。

string file = @"C:\Users\v-menlin\Documents\Visual Studio 2010\Projects\test\test\test.xml";
            XDocument doc = XDocument.Load( file );
            //use following code to parse a string
            //XDocument doc = XDocument.Parse( string );

//对于XML文件中所有的没加类似db:这种的元素，用下列方法
            XNamespace d = @"http://www.w3.org/2005/Atom";
            foreach ( XElement element in doc.Descendants( d + "title" ) )
            {
                Console.WriteLine( element.Value );
            }
            //<author>下面包含了<link>,一下的例子还示例了如何读取属性。
            foreach ( XElement element in doc.Descendants( d + "author" ) )
            {
                foreach ( XElement inelement in element.Descendants( d + "link" ) )
                {
                    Console.WriteLine( inelement.Attribute( "href" ).Value );
                    Console.WriteLine( inelement.Attribute( "rel" ).Value );
                }
            }

Console.WriteLine();
            //对于加了冒号前缀的元素，使用下列代码
            XNamespace db = @"http://www.douban.com/xmlns/";
            foreach ( XElement element in doc.Descendants( db + "attribute" ) )
            {
                Console.WriteLine( element.Attribute( "name" ).Value );
                Console.WriteLine( element.Value );
            }
            //其实只是NameSpace的头部换了一下。

//下面列出其他几个常用头部，直接换用。
            XNamespace gd = @"http://schemas.google.com/g/2005";
            XNamespace opensearch = @"http://a9.com/-/spec/opensearchrss/1.0/";

XML解析中的namespace初探的更多相关文章

XML 解析中，如何排除控制字符
XML 解析中,如何排除控制字符今天在解析一个中文的 XML时,始终报错 PCDATA invalid Char value 21 in Entity ,查询了一下这个 21 的ascii 值,发现 ...
xml解析中的sax解析
title: xml解析中的sax解析 tags: grammar_cjkRuby: true --- SAXPasser 类: parser(File file, DefaultHandler ha ...
关于XML解析中的CDATA的简单介绍
所有 XML 文档中的文本均会被解析器解析. 只有 CDATA 区段(CDATA section)中的文本会被解析器忽略. PCDATA PCDATA 指的是被解析的字符数据(Parsed Chara ...
java基础74 XML解析中的SAX解析相关知识点（网页知识）
1.SAX解析工具 SAX解析工具:是Sun公司提供的,内置JDK中.org.xml.sax.* 点击查看: DOM解析相关知识:以及DOM和SAX解析的原理(区别) 2.SAX解析的 ...
java基础71 XML解析中的【DOM和SAX解析工具】相关知识点（网页知识）
本文知识点(目录):本文下面的“实例及附录”全是DOM解析的相关内容 1.xml解析的含义 2.XML的解析方式 3.xml的解析工具 4.XML的解析原理 5.实例 6 ...
android xml解析中的null问题
当我们从服务器或者xml文件加载xml进行解析的时候,往往报告 nullpointer 错误.这是原始代码: String short_name = doc.getElementsByTagName( ...
xml解析中的DOM和SAX的区别
面试题:DMO和SAX的区别? DOM解析的优点:增删查改操作方便,缺点:占用内存较大,不适合解析大的XML文件: SAX解析的优点:占用内存小,解析快:缺点:不适合增删查改:
struts.xml 文件中的 namespace 属性图文详解
namespace:名称空间.默认值是""(空字符串). 名称空间+动作名称:构成了动作的访问路径
XML 解析中 SelectSingleNode 与 SelectNodes 使用通配符介绍
俺是 XML XPath的新手,最近因为项目需要,研究了一下基本的两个函数 SelectSingleNode和SelectNodes 是如何实用通配符的,分享以下基本经验: 假设有段XML 如下所示: ...

随机推荐

Vmdk文件如何使用，vmdk导入虚拟机VMware8.0教程
一.打开虚拟机VMware Workstation8.0,点击新建虚拟机. 二.进入虚拟机向导,选择自定义. 三.这里保持默认即可. 四.这里选择“我以后安装操作系统”. 五.这里选择Windows ...
C语言深度解剖读书笔记(6.函数的核心)
对于本节的函数内容其实就没什么难点了,但是对于函数这节又涉及到了顺序点的问题,我觉得可以还是忽略吧. 本节知识点: 1.函数中的顺序点:f(k,k++); 这样的问题大多跟编译器有关,不要去刻意追求 ...
NumberFormat 类
NumberFormat 表示数字的格式化类, 即:能够依照本地的风格习惯进行数字的显示. 此类的定义例如以下: public abstract class NumberFormat extends ...
FastDFS概要
本篇文章是我上级老大所写. 留在这里为了不弄丢. FastDFS是一款开源的轻量级分布式文件系统纯C实现,支持Linux, FreeBSD等UNIX系统类google FS, 不是通用的文件系统, ...
判断Webbrowser是否加载完成
var Form1: TForm1; glpDisp: IDispatch = nil; implementation {$R *.dfm} procedure TForm1.EmbeddedWB1D ...
php session 管理
function do_login(){ //获取用户名和密码信息,和数据库中比对 echo 111111111; dump($_POST); dump($_SESSION); echo 222222 ...
HTML 页面载入 Flash 插件的几种方法
前言之所以写这篇文章,主要是由于组长给提的一个新的需求--使用浏览器调用电脑的摄像头,来实现即时拍照的功能.在网上查了非常多资料,由于这样那样的原因,终于选择了使用flash插件来调用pc的摄像头. ...
NET5
ASP.NET5(RC1) - 翻译前言 ASP.NET 5 是一次令人惊叹的对于ASP.NET的创新革命. 他将构建目标瞄准了 .NET Core CLR, 同时ASP.NET又是对于云服务进行优 ...
Mqtt协议IOS移植完1
MQTTClient.h #import <Foundation/Foundation.h> @protocol MQTTDelegate <NSObject> /** * @ ...
Function 详解（一）
一直想写一系列关于javascript的东西,可惜从申请博客以来就一直抽不出时间来好好写上一番,今天终于熬到周末,是该好好整理一下,那么先从声明函数开始吧; 总所周知,在javascript中有匿名函 ...

XML解析中的namespace初探

XML解析中的namespace初探的更多相关文章

随机推荐

热门专题