XML中文本节点存储任意字符的方法
XML
xml是一种可扩展标签语言, 为众多浏览器支持解析, ajax更是利用xml来完成服务器和客户端之前的通信。
xml基本元素为 <label>xxx</label>, 并支持嵌套, 即标签的内容, 既可以是文本, 又可以是另外一个基本元素。
语法介绍 : http://www.w3school.com.cn/xml/xml_syntax.asp
XML转义字符
xml标签之间的内容,如果是文本的时候, 文本的内容中, 不能含有 < 和 & 字符,
否则会导致xml解析失败, 因为<被认为是标签开始的标识, 不应该出现的文本内容中,
&字符被认为是实体转义开始的标识, 所以这些字符都需要转义为实体形式:
<message>if salary < 1000 then</message>
对于xml字符串,不管是xml标签的内容是文本,还是另外一个基本元素, 都需要经过xml解析器解析
解析过程一则耗时, 二则对于一些乱码字符(0-32 or 127-255)的存在解析器也容易报错,
也会解析终止,则xml字符中其他的部分不能被顺利解析出来。
对于这种情况,介绍一种可尝试的方法cdata。
XML CDATA
xml的所有字符都需要被解析器解析, 但是xml语法告诉我们,可以通过特殊声明(CDATA = Charactor Data 字符数据 ),
让标签的文本内容,不用经过解析。 只需要给 文本内容添加特殊的 开始和结束标记。
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。
CDATA 部分中的所有内容都会被解析器忽略。
CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束。
这样上面的例子可写为, < 使用原样书写,这就是cdata的好处,
一些人为书写的js脚本中含有大于号的, 可以通过这种方法注释掉,以通过xml校验(http://www.xmlvalidation.com/):
<message><![CDATA[if salary < 1000 then]]></message>
CDATA不足与应对
不足CDATA内容不能 再含有 CDATA的开始 和 结束标记,否则会打断CDATA解析,
这样就意味着CDATA的内容不能为任意字符串。
要想让CDATA存储任意内容,则转码必不可少, 则解析结果不是原始内容, 需要经过反转码,将结果还原。
方法:将CDATA存储的文本字符串, 全部使用HTMLEncode转义, 将所有可见字符转为实体引用,
即时, 将 & 转为 &
JS取到CDATA内容后, 再通过HTMLDecode反转码。
CDATA应用例子
<![CDATA[]]>为XML的文本内容,被转义为 实体引用, 后组成 xml 字符串,送到xml解析器中,构造出xml dom树,
js获取到cdata内容后, 使用HTMLDecode反转还原。
<html>
<head>
<script type="text/javascript" src="./JQuery.js"></script>
<style>
</style>
</head>
<body> <script type='text/javascript'>
txt="<bookstore><book>";
//txt=txt+"<title><![CDATA[Everyday <<>>></<></<></<>Italian]]></title>";
txt=txt+"<title><![CDATA[<![CDATA[]]>]]></title>";
//txt=txt+"<title>Everyday <<>>></<></<></<>Italian</title>"; //OK
txt=txt+"<author>Giada De Laurentiis</author>";
txt=txt+"<year>2005</year>";
txt=txt+"</book></bookstore>";
if (window.DOMParser)
{
parser=new DOMParser();
xmlDoc=parser.parseFromString(txt,"text/xml");
}
else // Internet Explorer
{
xmlDoc=new ActiveXObject("Microsoft.XMLDOM");
xmlDoc.async=false;
xmlDoc.loadXML(txt);
} var cdata = xmlDoc.getElementsByTagName("title")[0].childNodes[0].nodeValue
console.log(cdata) function HTMLDecode(text)
{
var temp = document.createElement("div");
temp.innerHTML = text; var output = temp.innerText || temp.textContent;
temp = null;
return output;
}
console.log(HTMLDecode(cdata)) </script>
</body>
</html>
XML中文本节点存储任意字符的方法的更多相关文章
- XML中的五个保留字符及实体引用
字符名称 字符 实体引用 和 & & 大于号 > > 小于号 < < 单引号 ‘ ' 双引号 “ " 在XML文档中,构成元素内 ...
- SpringMVC项目中web.xml中的节点载入顺序问题
SpringMVC项目中web.xml中的节点载入顺序问题,之前以为web.xml中就是一些配置信息,和节点的顺序没有关系.后来才发现初始化时的载入顺序是和节点的顺序相关的. 完整的web.xml文件 ...
- Dom4j向XML中增加节点与属性——(四)
先获取到节点,然后在节点山添加Element 添加节点 添加属性 设置开始标签与结束标签的值book.addElement("描述").addAttribute("nam ...
- XPath可以快速定位到Xml中的节点或者属性。XPath语法很简单,但是强大够用,它也是使用xslt的基础知识。
示例Xml: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 <?xml versio ...
- DOM中文本节点索引方法
问题 对于 jquery 接口text()只能取到有标签的 dom对象中 文本内容. 如果索引对象本身就是文本节点,则不好索引到, 没有相关的索引选择器. 例如: 对于<input>aaa ...
- [转]XML中必须进行转义的字符
转自:http://jaenson.iteye.com/blog/945469 编写XML代码经常遗漏的常识: XML实体中不允许出现"&","<" ...
- (转)XML中必须进行转义的字符
场景:在工作中接触到很多xml文件,为了更好的操作这些文件,所有很有必要熟知xml文件的相关语义. 1 引入 编写XML代码经常遗漏的常识: XML实体中不允许出现"&", ...
- python文本 单独处理每个字符的方法汇总
python文本 单独处理字符串每个字符的方法汇总 场景: 用每次处理一个字符的方式处理字符串 方法: 1.使用list(str) >>> a='abcdefg' >&g ...
- C#删除xml中某个节点的子节点方法
if (File.Exists(xmlFilePath)) { XmlDocument xmlDoc = new XmlDocument(); xmlDoc.Load(xmlFilePath); Xm ...
随机推荐
- Android Immersive Mode (沉浸模式) 还是 Translucent Bars (透明状态栏)
Immersive Mode (沉浸模式) 还是 Translucent Bars (透明状态栏) [科普]什么叫真正的“沉浸式”状态栏? 为什么在国内会有很多用户把「透明栏」(Translucent ...
- topcoder SRM 622 DIV2 FibonacciDiv2
关于斐波那契数列,由于数据量比较小, 直接打表了,代码写的比较戳 #include <iostream> #include <vector> #include <algo ...
- 如何伪装成为一名前端(JS方向)
作为一个菜鸟级别的.NET开发者,在连服务器都没搞定的情况下,要研究前端,这是在扯淡,不过,迫于工作的需要,时常需要去前端打杂,所以经常伪装成为一名前端,有时候竟产生错觉,去应聘Y一份前端work吧. ...
- 5分钟windows wamp php安装phpunit 2015最新安装实践
16:11 2015/11/235分钟windows wamp php安装phpunit 2015最新安装实践我花了一个下午和一个上午的时间注意:步骤中添加环境变量多的时候要保存很多步,知道窗口都自动 ...
- [CareerCup] 15.3 Renting Apartment III 租房之三
Building #11 is undergoing a major renovation. Implement a query to close all requests from apartmen ...
- [CareerCup] 15.2 Renting Apartment II 租房之二
Write a SQL query to get a list of all buildings and the number of open requests (Requests in which ...
- zju(6)中断控制实验
1.实验目的 1.学习和掌握Linux下中断驱动的写法: 二.实验内容 1.编写EduKit-IV实验箱Linux操作系统下按键key的驱动: 2.编写EduKit-IV实验箱Linux操作系统下按键 ...
- Hibernate简单实例
1.配置hibernate.cfg.xml文件(名字必须这么写): <?xml version='1.0' encoding='utf-8'?> <!DOCTYPE hibernat ...
- BizTalk开发系列(七) Hello World2
之前根据BizTalk的订阅原理,使用BizTalk管理控制台创建了第一个应用程序 Hello World.但是由于控制台的开发功能有限,绝大多数的BizTalk程序都是在集成开发环境Visual S ...
- C#编程总结 字符转码
为了适应某种特殊需要,字符需要根据规则进行转码,便于传输.展现以及其他操作等. 看看下面的转码,就知道他的用处了. 1.字符串转码 根据原编码格式与目标编码格式,完成转换.不过可能出现乱码哦.上一章已 ...