解决“在多字节的目标代码页中,没有此Unicode字符可以映射到的字符”
今天在处理Google网站管理员中的500错误时发现这样一些URL:
http://www.cnblogs.com/Garnai/tag/3D%3F%96%CA/
http://www.cnblogs.com/henryfan/tag/%3F%3F%3F%90%B6%90%AC%3F%8C%8F/
http://www.cnblogs.com/zhangpengshou/tag/%3F%96%DA%3F%97%9D%94V%8FC%3F/
http://www.cnblogs.com/henryfan/tag/%3F%3F%3F%90%B6%90%AC%3F%8C%8F/
...
这些URL不仅出现500错误,而且不显示自定义错误,只显示ASP.NET的默认错误页面:

服务器日志中记录具体的错误信息是:
[ArgumentOutOfRangeException: 在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符。 (异常来自 HRESULT:0x80070459)]
System.Runtime.InteropServices.Marshal.ThrowExceptionForHRInternal(Int32 errorCode, IntPtr errorInfo) +0
System.Runtime.InteropServices.Marshal.ThrowExceptionForHR(Int32 errorCode) +13563503
System.Web.Hosting.IIS7WorkerRequest.GetServerVariableInternal(String name) +50
System.Web.Hosting.IIS7WorkerRequest.ReadRequestHeaders() +144
System.Web.Hosting.IIS7WorkerRequest.GetKnownRequestHeader(Int32 index) +109
System.Web.HttpWorkerRequest.HasEntityBody() +27
System.Web.HttpRequest.GetEncodingFromHeaders() +126
System.Web.HttpRequest.get_ContentEncoding() +162
System.Web.HttpRequest.get_QueryStringEncoding() +10
System.Web.HttpRequest.get_QueryStringText() +209
System.Web.HttpRequest.ValidateInputIfRequiredByConfig() +87
System.Web.PipelineStepManager.ValidateHelper(HttpContext context) +55
对应的英文错误信息是:
No mapping for the Unicode character exists in the target multi-byte code page.
从这些出错的URL中观察到了一个规律:都包含%3F这个编码,解码出来对应的字符是?。
从错误信息的代码执行堆栈信息 System.Web.HttpRequest.get_QueryStringText() 中,可以看出错误发生在从URL中读取查询字符串的时候。
可是出错的URL中并没有查询字符串。。。
后来突然想到,ASP.NET是先进行UrlDecode,然后再进行get_QueryStringText()的。
比如将 http://www.cnblogs.com/Garnai/tag/3D%3F%96%CA/ 进行URLDecode之后得到的URL是:
http://www.cnblogs.com/Garnai/tag/3D?柺/
看到没有,出现了问号,变成有查询字符串的URL。于是,ASP.NET将问号之后的字符作为key进行读取,由于key是不支持中文的,于是引发“在多字节的目标代码页中,没有此Unicode字符可以映射到的字符”。如果ASP.NET先进行get_QueryStringText(),再进行UrlDecode就不会触发这个问题,可是ASP.NET偏偏不这么干。
那如何解决这个问题?
虽然问题出在ASP.NET,但我们无法改变ASP.NET,只能另辟蹊径。
既然是ASP.NET处理上的问题,那我们别无选择,只能抢在ASP.NET之前拦截这样的URL请求,而进行这样的拦截最简单的工具就是IIS的Url Rewrite module。
根据我们的应用场景,在rewriteRules.config中添加一条规则——在URL中如果/tag/之后出现问号就直接返回404,规则定义如下:
<rule name="block_invalid_tag_url" stopProcessing="true">
<match url="^[^/]+/tag/.*?\?.*$" />
<action type="CustomResponse" statusCode="404" statusReason="The request URL is invalid"
statusDescription="The request URL is invalid" />
</rule>
然后就搞定了这个问题,写了这篇博客。
解决“在多字节的目标代码页中,没有此Unicode字符可以映射到的字符”的更多相关文章
- 在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符。 (#1113)
报错 在使用MySQL-Front导入sql文件时报错1113:在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符. (#1113) 解决方案 导入.sql文件时,单击 选择文件对话 ...
- mysql-front导入数据失败:“在多字节的目标代码页中,没有此 Unicode 字符可以映射到的字符”
mysql-front导入sql文件失败,弹出框显示如下: 解决方法:在选择文件时,选择合适的字符集即可 参考:http://www.th7.cn/db/mysql/201604/185149.sht ...
- excel导入sql server 文本被截断,或者一个或多个字符在目标代码页中没有匹配项 错误处理
excel导入sql server 文本被截断,或者一个或多个字符在目标代码页中没有匹配项 错误处理方法: 方案1:修改注册表 出现文本被截断的原因是SQL Server的导入导出为了确定数据表的字段 ...
- Excel 导入 Sql Server出错——“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”错误的解决
有人说应该先转成Access, 再转到Sql Server. 其实用处并不大, 要截断的还是被截断了. 原因是,SQL Server的导入导出为了确定数据表的字段类型,取excel文件的前8行来判别. ...
- Excel导入数据到Sql server 中出错:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”
从Excel导入数据到Sql server 时,由于表中的数据有的很长,导入时出现如下错误(如果数据不是很长,255内以内,则不会出现错误): 出错原因: SQL Server的导入导出为了确定数据表 ...
- sqlserver导入Excel数据 总是报错:错误 0xc020901c: 数据流任务 1: 输出“Excel 源输出”(55) 上的 输出列“T2”(64) 出错。返回的列状态是:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项
在网络上搜索解决办法,解决办法是把excel导入到access数据库中,再把access数据库导入到sqlsever中,公司机器上不让安装office工具,问了一个同事得到的回答是把数据中很长的那行数 ...
- 同构体字符串(如果 s 中的字符可以被替换得到 t ,那么这两个字符串是同构的。 所有出现的字符都必须用另一个字符替换,同时保留字符的顺序。两个字符不能映射到同一个字符上,但字符可以映射自己本身。)
示例 1: 输入: s = "egg", t = "add" 输出: true 示例 2: 输入: s = "foo", t = " ...
- Windows代码页、区域
目录 第1章代码页 1 1 代码页 1 1.1 单字节字符集 1 1.2 双字节字符集 1 1.3 多字节字符集 1 1.4 ANSI代码页 2 2 枚举代码页 ...
- 刨根究底字符编码之七——ANSI编码与代码页(Code Page)
ANSI编码与代码页(Code Page) 一.ANSI编码 1. 如前所述,在全世界所有国家和民族的文字符号统一编码的Unicode编码方案问世之前,各个国家.民族为了用计算机记录并显示自己的字符, ...
随机推荐
- “数学口袋精灵”第二个Sprint计划(第十天)总结
第二阶段Sprint完成情况: 目标:完成一个小游戏 情况:ui基本完成. 代码基本也完成了,部分未完善. 音乐方面有点小bug,正在完善. 具体运行结果(截图): 首页: 游戏界面(可以计算多个运算 ...
- MySQL_财务统计各产品品类各城市上周收入毛利表_20161202
注:财务需要统计各产品品类各城市上周毛利情况 下面这样的表是沟通后展现的形式.数据展现形式我认为的大都是行列转 列转行的转置 从财务角度这样展现形式比较适合. 由于黄色部分为汇总项目,因此我拆分成9个 ...
- c#中获取数组的行列个数的方法
GetUpperBound可以获取数组的最高下标.GetLowerBound可以获取数组的最低下标.这样就可以实现对数组的遍历//定义二维数组string[,] myStrArr2=new strin ...
- socket-自我总结(1)
socket是个啥:我的总结如下: socket:针对服务器----客户端socket,进行打开,读写,管理的操作. socket也称套接字,IP跟端口.用来对两台服务器之间的通信的.一个IP跟端口, ...
- 在Linux下使用RAID--使用mdadm工具创建软件Raid 0(1)
在Linux下使用RAID--使用mdadm工具创建软件Raid 0(1) RAID即廉价磁盘冗余阵列,其高可用性和可靠性适用于大规模环境中,相比正常使用,数据更需要被保护.RAID是一些磁盘的集合, ...
- Towers of Hanoi
Your mission is to move the stack from the left peg to the right peg. The rules are well known: Only ...
- 技术英文单词贴--W
W widget 小工具,小部件
- PHP对自己I/O流访问的封装(转)
php://stdin:访问PHP进程相应的输入流,比如用在获取cli执行脚本时的键盘输入. php://stdout:访问PHP进程相应的输出流. php://stderr:访问PHP进程相应的错误 ...
- hdu 5826 (物理) physics
题目:这里 题意:光滑的水平直线上有n个质量相等的小球,已知每个小球的初始位置,初始速度和方向,每个小球的每个时刻的加速度a都满足a*v=c,v是该时刻的速度,c是已知的 常数,小球之间的碰撞是完全碰 ...
- java JVM垃圾回收机制
Java语言出来之前,大家都在拼命的写C或者C++的程序,而此时存在一个很大的矛盾,C++等语言创建对象要不断的去开辟空间,不用的时候有需要不断的去释放控件,既要写构造函数,又要写析构函数,很多时候都 ...