escape、encodeURI和encodeURIComponent的区别
1.简单解释
简单来说,escape是对字符串(string)进行编码(而另外两种是对URL),作用是让它们在所有电脑上可读。
编码之后的效果是%XX或者%uXXXX这种形式。
其中 ASCII字母、数字、@*/+ ,这几个字符不会被编码,其余的都会。
最关键的是,当你需要对URL编码时,请忘记这个方法,这个方法是针对字符串使用的,不适用于URL。
2. encodeURI和encodeURIComponent
对URL编码是常见的事,所以这两个方法应该是实际中要特别注意的。
它们都是编码URL,唯一区别就是编码的字符范围,其中
encodeURI方法不会对下列字符编码 ASCII字母、数字、~!@#$&*()=:/,;?+'
encodeURIComponent方法不会对下列字符编码 ASCII字母、数字、~!*()'
也就是encodeURIComponent编码的范围更广,会将http://XXX中的//也编码,会导致URL不可用。(其实java中的URLEncoder.encode(str,char)也类似于这个方法,会导致URL不可用)
3简单使用
3.1编码中文
var param = "中文";
console.log(escape(param));
console.log(encodeURI(param));
console.log(encodeURIComponent(param));
结果:

3.2 encodeURI和encodeURIComponent编码URL
var url = "http://localhost:85/Exam/settingAction_saveSettings.action?safeHatNumLength=测试";
console.log(encodeURI(url));
console.log(encodeURIComponent(url));
结果:
http://localhost:85/Exam/settingAction_saveSettings.action?safeHatNumLength=%E6%B5%8B%E8%AF%95
http%3A%2F%2Flocalhost%3A85%2FExam%2FsettingAction_saveSettings.action%3FsafeHatNumLength%3D%E6%B5%8B%E8%AF%95
4.使用场景
1、如果只是编码字符串,不和URL有半毛钱关系,那么用escape,而且这个方法一般不会用到。
2、如果你需要编码整个URL,然后需要使用这个URL,那么用encodeURI。
3、当你需要编码URL中的参数的时候,那么encodeURIComponent是最好方法。
5.测试URL传中文参数问题
此时tomcat的编码是iso8859-1默认编码,后台采用struts2的属性驱动接受。并且进行解码: (Java后台解码)
System.out.println(safeHatNumLength);
try {
System.out.println(URLDecoder.decode(safeHatNumLength,"UTF-8"));
} catch (UnsupportedEncodingException e1) {
e1.printStackTrace();
}
5.1直接在url中输入中文查看后台:
http://localhost:85/Exam/settingAction_saveSettings.action?safeHatNumLength=测试
结果:
æµè¯
原因:直接访问浏览器会将中文采用utf-8编码传到后台,后台tomcat接收到之后采用iso8859-1解码所以乱码
5.2window.open不编码直接访问
var url = "http://localhost:85/Exam/settingAction_saveSettings.action?safeHatNumLength=测试";
window.open(encodeURI(url));
结果与原因同上同上
5.3 URL中文参数两次编码得到正确结果(一次编码不能得到正确结果)
总结:参数携带中文需要两次编码,如下:
var url = encodeURI(encodeURI("http://localhost:85/Exam/settingAction_saveSettings.do?safeHatNumLength=测试"));
console.log(url);
window.open(url);
结果:
%E6%B5%8B%E8%AF%95
测试
原因:两次编码传到后台之后,tomcat收到参数第一次进行解码之后变为一次utf-8编码的字符串,所以再次调用解码一次就变为中文。
5.4 表单get方法提交一次编码就可以
<form id="testForm" action="/Exam/settingAction_saveSettings.do" method="get">
<input name="safeHatNumLength" />
<input type="button" value="提交" onclick="submitForm();" />
</form>
<script>
function submitForm() {
$.get("/Exam/settingAction_saveSettings.do",encodeURI($("#testForm").serialize()));
}
</script>

后台结果::
%E9%97%AE%E9%97%AE
问问
总结:
如果只对参数编码用encodeURIComponent编码就可以,当然用 encodeURI也可以,如果不生效可以用两次编码。
如果是对整个URL进行编码最好用encodeURI,而且是两次编码 ,否则有可能不必生效。
判断是否生效只需要看带到后台的参数是否是编码后的格式,或者url的地址是否是编码之后的。
补充:浏览器也可以查看默认编码:
alert(document.charset)
关于两次编码的原因:
假设参数是一个"中"字
1.第一次encodeURI,按照utf-8方式获取字节数组变成[-28,-72-83],对字节码数组进行遍历,把每个字节转化成对应的16进制数,这样就变成了[E4,B8,AD],最后变成[%E4,%B8,%AD]
2.第二次encodeURI,把数组最后变成[%25E4,%25B8,%25AD]然后就把处理后的数据[%25E4,%25B8,%25AD]发往服务器端,
当应用服务器调用getParameter方法,getParameter方法会去向应用服务器请求参数,应用服务器最初获得的就是发送来的[%25E4,%25B8,%25AD],
应用服务器会对这个数据进行URLdecode操作,URldecode操作和encodeURL操作是相反的操作,处理结果就是[%E4,%B8,%AD],并把这个值返回给getParameter方法,然后再在服务器端中调用相应的URL转码方法或者是函数 就可以把数据还原成最初页面发送过来的中文“中”了。
URL编码与两次encodeURI
当使用地址栏提交查询参数时,如果不编码,非英文字符会按照操作系统的字符集进行编码提交到服务器,服务器会按照配置的字符集进行解码,所以如果两者不一致就会导致乱码。
encodeURI函数采用UTF-8对URL进行编码,所以如果服务器在进行解码时使用的是其他的编码方式就会出现乱码,默认的服务器配置的解码字符集都不是UTF-8,所以大部分情况下地址栏提交中文查询参数时会产生乱码;针对这种情况,可以连续使用两次encodeURI在客户端(主要指浏览器)对非英文字符进行编码,然后在服务端使用Java.NET.URLDecoder(String."UTF-8")解码,即可得到正确的中文。
如果只进行一次encodeURI,得到的是UTF-8形式的URL,服务器端通过request.getParameter()解码查询参数(通常是iso-8859-1)就会得到乱码。
如果进行两次encodeURI,第一次编码得到的是UTF-8形式的URL,第二次编码得到的依然是UTF-8形式的URL,但是在效果上相当于首先进行了一次UTF-8编码(此时已经全部转换为ASCII字符),再进行了一次iso-8859-1编码,因为对英文字符来说UTF-8编码和ISO-8859-1编码的效果相同。在服务器端,首先通过request.getParameter()自动进行第一次解码(可能是gb2312,gbk,utf-8,iso-8859-1等字符集,对结果无影响)得到ascii字符,然后再使用UTF-8进行第二次解码,通常使用java.net.URLDecoder("","UTF-8")方法。
两次编码两次解码的过程为:
UTF-8编码->UTF-8(iso-8859-1)编码->iso-8859-1解码->UTF-8解码,编码和解码的过程是对称的,所以不会出现乱码。(实际tomcat服务器收到参数之后就会进行一次解码,也就是第一次解码)
encodeURL函数主要是来对URI来做转码,它默认是采用的UTF-8的编码.
. UTF-8编码的格式:一个汉字来三个字节构成,每一个字节会转换成16进制的编码,同时添加上%号
1.首先前台测试编码效果:(验证上面的编码效果)
(1)第一次编码:
console.log(encodeURI("中"));
console.log(encodeURI(encodeURI("中")));
结果:
%E4%B8%AD
%25E4%25B8%25AD
2.下面进行后台Java接受演示
一个简单的servlet代码:
Enumeration<String> parameterNames = request.getParameterNames();
while (parameterNames.hasMoreElements()) {
String string = (String) parameterNames.nextElement();
log.info("key -> {},value -> {}", string, request.getParameter(string));
}
(1)测试一次编码,tomcat中编码为iso8859-1(这种也无法进行解码,已经发生乱码)
直接URL中输入: http://localhost/index.html?param=中
实际谷歌浏览器自动编码为:http://localhost/index.html?param=%E4%B8%AD
查看看后台结果:
2018-12-27 19:09:02 [cn.ding.test.TestServlet]-[INFO] key -> param,value -> ä¸
(2)测试一次编码,tomcat中编码为UTF-8(一次编码后台正常接受到的就是正常的中文)
直接URL中输入: http://localhost/index.html?param=中
实际谷歌浏览器自动编码为:http://localhost/index.html?param=%E4%B8%AD
查看看后台结果:
2018-12-27 19:13:55 [cn.ding.test.TestServlet]-[INFO] key -> param,value -> 中
(3)测试2次编码,tomcat中编码为iso8859-1
直接URL中输入: http://localhost/index.html?param=%25E4%25B8%25AD
结果: (可以看出来tomcat解码了一次)
2018-12-27 19:16:12 [cn.ding.test.TestServlet]-[INFO] key -> param,value -> %E4%B8%AD
此时如果我们用下面方法可以将参数解析为正常的中文:
URLDecoder.decode("%E4%B8%AD", "utf-8")
(4)测试2次编码,tomcat中编码为utf-8
直接URL中输入: http://localhost/index.html?param=%25E4%25B8%25AD
结果: (可以看出来tomcat解码了一次)
2018-12-27 19:19:10 [cn.ding.test.TestServlet]-[INFO] key -> param,value -> %E4%B8%AD
此时如果我们用下面方法可以将参数解析为正常的中文:
URLDecoder.decode("%E4%B8%AD", "utf-8")
通过上面明白了,实际前台encodeURI编码的次数与你后台默认的编码格式相关,如果你的后台默认是UTF-8编码,前台对中文只需要一次encodeURI即可;如果后台默认的是ios8859-1,一次编码之后将造成乱码无法还原,前台编码两次后台收到的解码一次的效果,所以才有utf-8解码一次即可还原。
也就是你需要记住tomcat收到参数之后就会用server.xml中的编码格式进行一次解码,所以编码解码与次数问题就很好理解了。
补充:Tomcat编码问题---------------实际上此编码告诉tomcat以哪种编码解析参数
tomcat8以后默认编码格式是utf-8;7之前的都是iso8859-1
如果默认情况下,tomcat使用的的编码方式:iso8859-1
修改tomcat下的conf/server.xml文件
找到如下代码:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" />
这段代码规定了Tomcat监听HTTP请求的端口号等信息。
可以在这里添加一个属性:URIEncoding,将该属性值设置为UTF-8,即可让Tomcat(默认ISO-8859-1编码)以UTF-8的编码处理get请求。
修改完成后:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />
escape、encodeURI和encodeURIComponent的区别的更多相关文章
- JS中 escape, encodeURI 和 encodeURIComponent的区别
为避免Url字符串在传递过程中的乱码,我们一般需要对字符串进行处理. 在Javascript中实现此功能的全局对象有3个,分别是:escape(), encodeURI() 和 encodeURI ...
- escape encodeURI和encodeURIComponent的区别
escape(与之对应->unescape) escape是对字符串(string)进行编码(而另外两种是对URL),作用是让它们在所有电脑上可读.编码之后的效果是%XX或者%uXXXX这种形式 ...
- escape(), encodeURI()和encodeURIComponent()(转)
escape(), encodeURI()和encodeURIComponent()是在Javascript中用于编码字符串的三个常用的方法,而他们之间的异同却困扰了很多的Javascript初学 ...
- encodeURI与encodeURIComponent的区别
webservice输出时选择的格式与Content-Type报文头有关 encodeURI与encodeURIComponent的区别:后者会将URI进行编码(包括"://")
- Javascript中escape(), encodeURI()和encodeURIComponent()之精析与比较
escape(), encodeURI()和encodeURIComponent()是在Javascript中用于编码字符串的三个常用的方法,而他们之间的异同却困扰了很多的Javascript初学者, ...
- escape、encodeURI和encodeURIComponent的区别及使用
编码 javascript中的编码函数有三种 escape(string) encodeURI(string) encodeURIComponent(string) 解码 相应的解码函数也有以下三种 ...
- 深入分析escape()、encodeURI()、encodeURIComponent()的区别及示例
JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decod ...
- Javascript中escape()、encodeURI()、encodeURIComponent()的区别
JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decod ...
- js 中escape,encodeURI,encodeURIComponent的区别
escape:方法不能能够用来对统一资源(URI)进行编码,对其编码应使用encodeURI和encodeURIComponent encodeURI:encodeURI ()方法返回一个编码的 UR ...
随机推荐
- JSP 和 Servlet 的工作原理和生命周期
JSP的英文名叫Java Server Pages,翻译为中文是Java服务器页面的意思,其底层就是一个简化的Servlet设计,是由sum公司主导参与建立的一种动态网页技术标准.Servlet 就是 ...
- 洛谷P1776 宝物筛选_NOI导刊2010提高(02)(多重背包,单调队列)
为了学习单调队列优化DP奔向了此题... 基础的多重背包就不展开了.设\(f_{i,j}\)为选前\(i\)个物品,重量不超过\(j\)的最大价值,\(w\)为重量,\(v\)为价值(蒟蒻有强迫症,特 ...
- bzoj1001/luogu4001 狼抓兔子 (最小割/平面图最小割转对偶图最短路)
平面图转对偶图:先在原图中加一个s->t的边,然后对每个面建一个点,对每条分隔两个面的边加一条连接这两个面对应点的边,边权等于原边权. 然后从刚才加的s->t分割出来的两面对应的两个点跑最 ...
- Python--Django学习笔记2
本篇介绍Django中的Model层. 首先介绍sqlite3,这是在当前版本中Django默认使用的数据库,sqlite也是Android中所使用的数据库. 接着介绍最最最常见的MySQL数据库如何 ...
- 洛谷P4383 林克卡特树
题意:树上最长不相交k条链. #include <cstdio> #include <algorithm> #include <cstring> typedef l ...
- A1041. Be Unique
Being unique is so important to people on Mars that even their lottery is designed in a unique way. ...
- [luogu3197][越狱]
luogu3197 思路 看了很久没思路,看了题解发现自己好zz.用全部的情况减去不合法的情况就行了.全部的情况就是每个人随便选,总共有\(m^n\)种情况,然后考虑不合法的情况,也就是任意相邻的两个 ...
- 硬盘读取速度变慢 — 当前传送模式: PIO模式
网上搜索了一下,找到两篇文章: 标题:硬盘读取速度变慢 当前传输模式pio的解决方法 http://www.veryhuo.com/a/view/52786.html (解决思路:先卸载驱动,重启 ...
- javascript面向对象精要第三章对象整理精要
什么是对象的数据属性?什么是对象的访问器属性?[put]方法是默认创建数据属性的,访 问器属性不包含值而是定义了一个单属性被读取时调用的函数(getter)和当一个属性被写入时 调用的函数(sette ...
- dedecms获取顶级栏目名称、二级栏目名称实现方法 转
织梦DEDECMS文章.栏目页获取当前页面顶级栏目名称的方法 在用织梦做一些项目时,时常会碰到需要在当前页面调用顶级栏目名称的时候,织梦默认{dede:field name='typename' /} ...