自从我们的项目数据层从读取数据库改为读取接口服务后,经常会出现一些类似于的错误。我们的数据结构如下所示

    <type><![CDATA[gp]]></type>
<detail><![CDATA[刘?->->,C#为正则表达式提供了强大的支持,本课程重点讲述在C#环境下使用正则表达式,并能够学会分析创建属于自己的正则表达式,学习正则表达式请访问http://edu.51cto.com/course/course_id-4664.html]]></detail>
<housepurpose><![CDATA[住宅]]></housepurpose>

接口数据

在用户输入的数据中常常有一些小人箭头之类的特殊符号(由于在www.cnblogs.com/xietong下不支持这些特殊符号,所以读者在我举例的数据结构中看不到这些特殊符号),我曾经尝试匹配这些特殊字符,然而未能找到与之相匹配的unicode代码区块,所以采用了匹配正常字符的方式来获取合法的数据用于xml解析。可以看到我们数据中的字符包括字母数字、各种标点、空白符,据此可以写出我们的正则表达式"(\w|\p{P}|\s)*"。在RegxTest下测试发现无法匹配“<>=”这些符号,加上这些符号后正则表达式为"(\w|\p{P}|[<>=]|\s)*",经测试,发现可以获取到所有正常的字符,在c#中代码如下:

           string content = sb.ToString();
MatchCollection matches = Regex.Matches(content, @"(\w|\p{P}|[<>=]|\s)*");
sb = new StringBuilder();
foreach (Match m in matches)
{
sb.Append(m.Value);
}
content = sb.ToString();

  在运行之后发现类似异常虽然少了很多,但还是有一部分异常,查看这些异常发现造成这些异常的原因正是存在16进制的字符,数据如下:

  <shinimgs><![CDATA[http://img6n.soufunimg.com/viewimage/agents/2015_08/24/M09/01/12/wKgEUFXaYrSILIxEAAClop_zcLMAABrYAEF2hoAAKW6316/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M01/0C/FA/wKgEKlXaYrWIOQbmAACrV5PpfxIAAURwACqFtkAAKtv885/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M04/0C/FA/wKgELFXaYrSIVo9xAAB3vv5fpe8AAURuwMY6CsAAHfW851/120x120.jpg;http://img6n.soufunimg.com/viewimage/agents/2015_08/24/M00/01/12/wKgEUFXaYrSIQR6mAABxJ5OYy6AAABrWQPffz0AAHE_808/120x120.jpg]]></shinimgs>
<xqimgs><![CDATA[http://img7.soufunimg.com/viewimage/agents/2015_05/11/M08/08/BD/wKgELFVQEdqIFbqUAADuyIgGO48AANp_AOJcvcAAO7g917/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M01/0C/FA/wKgEK1XaYrWIaxkaAACwvmucOS8AAURwACqwkgAALDW084/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_07/04/M08/0A/E5/wKgEKlWXSA2IXitfAACu3NyaN_wAARBpgNFzlcAAK70576/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_05/11/M08/08/BD/wKgELFVQEd-IJevUAACSMy8yODUAANp_AOZCjMAAJJL453/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_05/11/M09/08/BD/wKgELFVQEd-ISF5YAADAL5IP7McAANqDAHBU9cAAMBH365/120x120.jpg]]></xqimgs>

如果直接将0x式样的16进制去掉,那么这些图片就无法找到正确地址,似乎有些粗鲁。为此,我决定将相应的变量先取出来,然后在读取出来的DataSet中重新对相应字段赋值。我的代码如下:

    MatchCollection imatches = null;
if (Regex.IsMatch(content, "0x[0-9a-fA-F]+", RegexOptions.IgnoreCase))
{
Regex regex = new Regex(@"<(?'tag'\w+?)><!\[CDATA\[(?'text'.*?0[Xx].*?)\]\]></\k'tag'>");
imatches = regex.Matches(content);
if (imatches != null)
{
content = regex.Replace(content, "<${tag}></${tag}>");
}
} System.Xml.XmlDocument xd = new System.Xml.XmlDocument();
xd.LoadXml(content);
System.Xml.XmlNodeReader xnr = new System.Xml.XmlNodeReader(xd);
ds.ReadXml(xnr);
xnr.Close();
if (imatches != null && imatches.Count > && ds != null && ds.Tables.Count > )
{
foreach (Match m in imatches)
{
foreach (DataTable table in ds.Tables)
{
if (table.Columns.Contains(m.Groups["tag"].Value))
{
table.Rows[][m.Groups["tag"].Value] = m.Groups["text"].Value;
break;
}
}
}
}

在上面的代码中用到了正则的文本替换及分租,如果有不理解的地方可以在http://edu.51cto.com/course/course_id-4664.html中学习一下基本的C#正则表达式知识。

上面的代码经测试可以正常运行,但放到那里呢,虽然在try-catch抛出异常,在异常中处理的话要耗费几百个时钟周期,但鉴于问题数据只是一小部分,并且上面的正则表达式的效率并不太高,所以我将上面的代码放在了catch语句块中。

“.”(十六进制值 0x00)是无效的字符解决方案的更多相关文章

  1. [No0000133]c# ERROR:“.”(十六进制值 0x00)是无效的字符

    December 24, 2013 c# exception “.”(十六进制值 0x00)是无效的字符. 解决方法:常见于socket方式连接(包括HTTP方式)等.报文交互时候,对方会在字符串后面 ...

  2. 调用webservice接口,报错:(十六进制值0x01)是无效的字符

    #事故现场 调用webservice接口,报错:(十六进制值0x01)是无效的字符. 如图: 意思是webservice返回的信息中包含无效的字符,无法解析成xml: #分析 使用postman向we ...

  3. SSRS 在订阅的时候,在头值中找到无效的字符。将不重新发送邮件

    在头值中找到无效的字符.将不重新发送邮件 SSRS 在订阅的时候,在头值中找到无效的字符.将不重新发送邮件! 查看了一下,只要是发送文件类型的都不可以,改成HTML的就可以.然后重新把RS的报表文件友 ...

  4. XML 十六进制值 是无效的字符错误 解决方法之一 转

    /// <summary> /// 过滤非打印字符 /// </summary> /// <param name="tmp">待过滤</p ...

  5. C#十六进制值0x12,是一个无效字符 - 程序园

    原文:C#十六进制值0x12,是一个无效字符 - 程序园 我正在加载很多xml文档,其中一些返回错误,如“十六进制值0x12,是无效字符”,并且有不同的字符.如何删除它们?   我在这里做了一个小的研 ...

  6. MySql_十六进制值

    十六进制值 MySQL支持十六进制值.在数字上下文中,十六进制数如同整数(64位精度).在字符串上下文,如同二进制字符串,每对十六进制数字被转换为一个字符: mysql> SELECT x'4D ...

  7. 通过GetManifestResourceStream加载文件出现错误提示“null值”对于“stream”无效[转]

    本文解决了我的问题,收藏一下. 原文地址:http://blog.sina.com.cn/s/blog_a67799f601010atz.html 在做Mobile开发时,需要引入图片,用到了这个方法 ...

  8. CSS:CSS 颜色十六进制值

    ylbtech-CSS:CSS 颜色十六进制值 1.返回顶部 1. 根据十六进制值排序 所有浏览器都支持的颜色名 根据颜色名排序的相同列表 颜色名 十六进制颜色值 颜色 Black #000000   ...

  9. thinkphp事务处理以及无效时的解决方案(整理)

    thinkphp事务处理以及无效时的解决方案(整理) 一.总结 一句话总结:要程序里面支持事务,首先连接的数据库和数据表必须支持事务 mysql 1.InnoDB和MyISAM对事务的支持怎么样? I ...

随机推荐

  1. Uiautomator 2.0之Until类学习小记

    1. 状态条件-Uiobject2Condtion 1.1 一个UiObject2Condition代表UiObject2满足某个条件的特定状态,主要用于获取到组件释放处于某种状态. 1.2 简单示例 ...

  2. 浅析z-index(覆盖顺序)和定位

    多次在项目中遇到html页面元素的非期待重叠错误,多数还是position定位情况下z-index的问题.其实每次解决类似问题思路大致都是一样的,说到底还是对z-index的理解比较模糊,可以解决问题 ...

  3. JavaScript知识 一、JS的数据类型

    一.JS的数据类型 1.基本类型 JS共有5大基本类型,分别是: 1)Undefined.他只有一个值:undefined.如果一个变量被定义但是没有给他赋值,那么这个时候系统会默认给这个变量赋值为u ...

  4. VS2015 Enterprise 安装之惊险及收获

    前言 园子早早的就有人安装了VS 2015,自己也按捺不住了,也要赶快尝尝鲜!结果在其安装过程中一个小小的问题却困扰了我一天,这其中多亏了dudu耐心的解答才得以顺利完成,如果你也遇见这个问题,看过这 ...

  5. Python补充06 Python之道

    作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python有一个彩蛋,用下面语句调出: import this 该彩蛋的文档记录 ...

  6. Android自定义Dialog(美化界面)

    前言:在做项目的时候,发现dialog界面太丑陋,从csdn上下载了一份自定义dialog的源码,在他的基础上对界面进行美化...有需要的朋友可以直接拿走 效果图如下: 主要代码: /** * 自定义 ...

  7. ES6 - Note5:Promise

    1.Promise介绍 Promise最早是社区提出和实现,后面ES6将其写入标准,并原生提供Promise对象,是一种异步编程的解决方案,具体的概念大家可以去查看相关的资料.传统上处理异步都是以ca ...

  8. 窥探Swift编程之强大的Switch

    之前初识Swift中的Switch语句时,真的是让人眼前一亮,Swift中Switch语句有好多特有而且特好用的功能.说到Switch, 只要是写过程序的小伙伴对Switch并不陌生.其在程序中的出镜 ...

  9. 项目中遇到的Integer问题--转

    Integer类型值相等或不等分析 http://www.cnblogs.com/zzllx/p/5778470.html 看到博客园一位博友写的面试问题,其中一题是 Integer a = 1; I ...

  10. NET开发学习项目资源

    最近在整理资料时发现自己当初学习NET的一些项目资源,一直放在硬盘里不如拿来分享给初学者学习还是不错的. 项目代码为<精通ASP.NET20+SQL Server2005项目开发>书中源码 ...