今天在处理Google网站管理员中的500错误时发现这样一些URL:

http://www.cnblogs.com/Garnai/tag/3D%3F%96%CA/
http://www.cnblogs.com/henryfan/tag/%3F%3F%3F%90%B6%90%AC%3F%8C%8F/
http://www.cnblogs.com/zhangpengshou/tag/%3F%96%DA%3F%97%9D%94V%8FC%3F/
http://www.cnblogs.com/henryfan/tag/%3F%3F%3F%90%B6%90%AC%3F%8C%8F/
...

这些URL不仅出现500错误,而且不显示自定义错误,只显示ASP.NET的默认错误页面:

服务器日志中记录具体的错误信息是:

[ArgumentOutOfRangeException: 在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符。 (异常来自 HRESULT:0x80070459)]
System.Runtime.InteropServices.Marshal.ThrowExceptionForHRInternal(Int32 errorCode, IntPtr errorInfo) +0
System.Runtime.InteropServices.Marshal.ThrowExceptionForHR(Int32 errorCode) +13563503
System.Web.Hosting.IIS7WorkerRequest.GetServerVariableInternal(String name) +50
System.Web.Hosting.IIS7WorkerRequest.ReadRequestHeaders() +144
System.Web.Hosting.IIS7WorkerRequest.GetKnownRequestHeader(Int32 index) +109
System.Web.HttpWorkerRequest.HasEntityBody() +27
System.Web.HttpRequest.GetEncodingFromHeaders() +126
System.Web.HttpRequest.get_ContentEncoding() +162
System.Web.HttpRequest.get_QueryStringEncoding() +10
System.Web.HttpRequest.get_QueryStringText() +209
System.Web.HttpRequest.ValidateInputIfRequiredByConfig() +87
System.Web.PipelineStepManager.ValidateHelper(HttpContext context) +55

对应的英文错误信息是:

No mapping for the Unicode character exists in the target multi-byte code page.

从这些出错的URL中观察到了一个规律:都包含%3F这个编码,解码出来对应的字符是?。

从错误信息的代码执行堆栈信息 System.Web.HttpRequest.get_QueryStringText() 中,可以看出错误发生在从URL中读取查询字符串的时候。

可是出错的URL中并没有查询字符串。。。

后来突然想到,ASP.NET是先进行UrlDecode,然后再进行get_QueryStringText()的。

比如将  http://www.cnblogs.com/Garnai/tag/3D%3F%96%CA/ 进行URLDecode之后得到的URL是:

http://www.cnblogs.com/Garnai/tag/3D?柺/

看到没有,出现了问号,变成有查询字符串的URL。于是,ASP.NET将问号之后的字符作为key进行读取,由于key是不支持中文的,于是引发“在多字节的目标代码页中,没有此Unicode字符可以映射到的字符”。如果ASP.NET先进行get_QueryStringText(),再进行UrlDecode就不会触发这个问题,可是ASP.NET偏偏不这么干。

那如何解决这个问题?

虽然问题出在ASP.NET,但我们无法改变ASP.NET,只能另辟蹊径。

既然是ASP.NET处理上的问题,那我们别无选择,只能抢在ASP.NET之前拦截这样的URL请求,而进行这样的拦截最简单的工具就是IIS的Url Rewrite module。

根据我们的应用场景,在rewriteRules.config中添加一条规则——在URL中如果/tag/之后出现问号就直接返回404,规则定义如下:

<rule name="block_invalid_tag_url" stopProcessing="true">
<match url="^[^/]+/tag/.*?\?.*$" />
<action type="CustomResponse" statusCode="404" statusReason="The request URL is invalid"
statusDescription="The request URL is invalid" />
</rule>

然后就搞定了这个问题,写了这篇博客。

解决“在多字节的目标代码页中,没有此Unicode字符可以映射到的字符”的更多相关文章

  1. 在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符。 (#1113)

    报错 在使用MySQL-Front导入sql文件时报错1113:在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符. (#1113) 解决方案 导入.sql文件时,单击 选择文件对话 ...

  2. mysql-front导入数据失败:“在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符”

    mysql-front导入sql文件失败,弹出框显示如下: 解决方法:在选择文件时,选择合适的字符集即可 参考:http://www.th7.cn/db/mysql/201604/185149.sht ...

  3. excel导入sql server 文本被截断,或者一个或多个字符在目标代码页中没有匹配项 错误处理

    excel导入sql server 文本被截断,或者一个或多个字符在目标代码页中没有匹配项 错误处理方法: 方案1:修改注册表 出现文本被截断的原因是SQL Server的导入导出为了确定数据表的字段 ...

  4. Excel 导入 Sql Server出错——“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”错误的解决

    有人说应该先转成Access, 再转到Sql Server. 其实用处并不大, 要截断的还是被截断了. 原因是,SQL Server的导入导出为了确定数据表的字段类型,取excel文件的前8行来判别. ...

  5. Excel导入数据到Sql server 中出错:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”

    从Excel导入数据到Sql server 时,由于表中的数据有的很长,导入时出现如下错误(如果数据不是很长,255内以内,则不会出现错误): 出错原因: SQL Server的导入导出为了确定数据表 ...

  6. sqlserver导入Excel数据 总是报错:错误 0xc020901c: 数据流任务 1: 输出“Excel 源输出”(55) 上的 输出列“T2”(64) 出错。返回的列状态是:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项

    在网络上搜索解决办法,解决办法是把excel导入到access数据库中,再把access数据库导入到sqlsever中,公司机器上不让安装office工具,问了一个同事得到的回答是把数据中很长的那行数 ...

  7. 同构体字符串(如果 s 中的字符可以被替换得到 t ,那么这两个字符串是同构的。 所有出现的字符都必须用另一个字符替换,同时保留字符的顺序。两个字符不能映射到同一个字符上,但字符可以映射自己本身。)

    示例 1: 输入: s = "egg", t = "add" 输出: true 示例 2: 输入: s = "foo", t = " ...

  8. Windows代码页、区域

    目录 第1章代码页    1 1 代码页    1 1.1 单字节字符集    1 1.2 双字节字符集    1 1.3 多字节字符集    1 1.4 ANSI代码页    2 2 枚举代码页   ...

  9. 刨根究底字符编码之七——ANSI编码与代码页(Code Page)

    ANSI编码与代码页(Code Page) 一.ANSI编码 1. 如前所述,在全世界所有国家和民族的文字符号统一编码的Unicode编码方案问世之前,各个国家.民族为了用计算机记录并显示自己的字符, ...

随机推荐

  1. C++Builder Berlin 编译

    编译工程,一个单元有错误,就停下了, 能不能把所有单元都编译,一次处理所有单元的错误?

  2. 【转载】C++ IO库

    本篇随笔为转载,原贴地址:<C++ Primer>第8章 IO库 学习笔记. 1.IO类 #include <iostream> istream//从流中读取数据 ostrea ...

  3. RadGridView标头分行

  4. 用BlendFunc实现舞台灯光和刮刮卡效果

    [转]http://code.lovemiao.com/?p=136#more-136 之前写过一篇<不规则形状按钮的点击判定>,利用了CCRenderTexture创建一块画布,可以在上 ...

  5. 关于Android开发手机连接不上电脑问题解决方案

    1.当然首先你得将手机里的usb debug选项选上,否则lsusb是不会有你的设备的2. lsusb 查看usb设备id3. sudo vim /etc/udev/rules.d/51-androi ...

  6. JAXB 2.0 API is being loaded from the bootstrap classloader

    在使用webservice,mule esb等需要jaxb的项目里经常会出现 JAXB 2.0 API is being loaded from the bootstrap classloader这个 ...

  7. swift 批量 取出中间文本

    func stringmid_pl (wholestring:String,front:String,behind:String,inout return_string:String,getheroi ...

  8. Extjs学习笔记--Ext.tree.Panel

    Ext.create('Ext.tree.Panel', { title: 'Simple Tree', width: 200, height: 150, store: store, rootVisi ...

  9. AESwithJCE http://www.coderanch.com/how-to/content/AES_v1.html

    Using AES with Java Technology By Rags SrinivasJune 2003 In September 2000, the National Institute o ...

  10. (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...