java基础52 编码与解码
1、解码与编码的含义
编码:把看得懂的字符变成看不懂的码值,这个过程就叫编码
解码:根据码值查到相对应的字符,我们把这个过程就叫解码
注意:编码与解码时,我们一般使用统一的码表,否则非常容易出现乱码
2、常见的码表
1. ASCII:美国标准信息交换码。用一个字节的7位可以表示。
2. ISO8859-1:拉丁码表。欧洲码表,用一个字节的8位表示。
3. GB2312:英文占一个字节,中文占两个字节.中国的中文编码表。
4.GBK:中国的中文编码表升级,融合了更多的中文文字符号。
5.Unicode:国际标准码规范,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是unicode。
6.UTF-8:最多用三个字节来表示一个字符。
(我们接触最多的是iso8859-1、gbk、utf-8三种编码)
注意:ASCII码用7位表示一个字符,共128个字符,不够256个。 ISO-8859-1码是ASCII码的拓展,用8位表示一个字符,共256个字符。即:ISO8859-1码包含ASCII码
3、实例
package com.dhb.file; import java.io.IOException;
import java.util.Arrays; /**
* @author DSHORE / 2018-7-19
*
*/
public class Demo26 {
public static void main(String[] args) throws IOException {
String str1 = "中国";
byte[] buf1 = str1.getBytes("utf-8");//MyEclipse控台默认的是gbk编码
System.out.println("数组(utf-8):"+Arrays.toString(buf1)); str1 = new String(buf1,"utf-8");
System.out.println(str1);
str1 = new String(buf1,"gbk");
System.out.println(str1);//乱码,因为编码时用utf-8,解码时用gbk String str2 = "a我爱中国";
byte[] buf2 = str2.getBytes("Unicode");//编码与解码的时候指定的码表Unicode实际上就是用utf-16
System.out.println("数组(Unicode):"+Arrays.toString(buf2)); String str3 = "大家好";
byte[] buf3 = str3.getBytes();//默认使用gbk进行编码
//System.out.println(Arrays.toString(buf3));
str3 = new String(buf3,"ISO8859-1");
System.out.println(str3);//乱码,因为编码时用gbk,解码时用ISO8859-1
//出现乱码之后可以还原吗?
byte[] buf4 = str3.getBytes("ISO8859-1");
str3 = new String(buf4,"gbk");
System.out.println(str3);
//出现乱码之后都可以还原吗? 答:不一定能,例如:ASCII码和ISO8859-1码(有一部分不能)。因为ISO8859-1包含ASCII码
}
}
运行结果图

|
原创作者:DSHORE 作者主页:http://www.cnblogs.com/dshore123/ 原文出自:https://www.cnblogs.com/dshore123/p/9340285.html 欢迎转载,转载务必说明出处。(如果本文对您有帮助,可以点击一下右下角的 推荐,或评论,谢谢!) |
java基础52 编码与解码的更多相关文章
- java使用Base64编码和解码的图像文件
1.编码和解码下面的代码示例看: import java.awt.image.BufferedImage; import java.io.ByteArrayOutputStream; import j ...
- Java利用Base64编码和解码图片文件
1.编码与解码代码如下所示: import java.awt.image.BufferedImage; import java.io.ByteArrayOutputStream; import jav ...
- Day5 Pyhton基础之编码与解码(四)
1.编码与解码 1.1现在常用的编码类型
- Java 字符集,编码、解码
1. 计算机中文件.数据底层都是基于二进制的. 计算机底层并没有文本文件.图片文件之分,它只是记录着每个文件的二进制序列. 字符集:包含着字符和二进制序列之间的对应关系,一个字符对应一个二进制序列. ...
- Java基础——字符编码
一.ASII 美国(国家)信息交换标准(代)码. 计算机中只有数字,一切都是用数字表示,屏幕上显示的一个一个的字符也不例外. 一个字节可表示的数字为0-255,足以显示键盘上的所有的字符 例如. a ...
- js与java encodeURI 进行编码与解码
JS escape()使用转义序列替换某些字符来对字符串进行编码 JavaScript 中国 编码后 JavaScript %u4E2D%u56FD unescape()对使用 encodeUR ...
- Java基础(52):ClassCastException详解(转)
ClassCastException,从字面上看,是类型转换错误,通常是进行强制类型转换时候出的错误.下面对产生ClassCastException异常的原因进行分析,然后给出这种异常的解决方法. 这 ...
- java进行url编码和解码
public static String getURLEncoderString(String str) { String result = ""; if (null == str ...
- java中的url 编码与解码
什么是application/x-www-form-urlencoded字符串? 答:它是一种编码类型.当URL地址里包含非西欧字符的字符串时,系统会将这些字符转换成application/x-www ...
随机推荐
- tomcat和servlet的基本了解
看不清的可以下载到本地观看
- GridView中网络图片延迟加载导致高度计算失败的问题
在使用下拉刷新以及加载更多控件的时候,出现了列表上滚不完的现象,经过半天的分析,最后得出结论:由于图片采用了延迟加载,导致列表按照没有加载图片时候的大小进行布局,相关的加载更多控件也就傻逼了. 最终解 ...
- 解题:NOI 2007 社交网络
题面 先跑一边Floyd乘法原理统计任意两点间最短路数目,然后再枚举一次按照题意即可求出答案,会写那道JSOI2007就会这个 #include<cstdio> #include<c ...
- struts的namespace理解
转载: namespace决定了action的访问路径,默认为"",可以接受所有路径的action namespace可以写为/,或者/xxx,或者/xxx/yyy,对应的acti ...
- servlet解析
什么是Servlet2,Servlet有什么作用3,Servlet的生命周期4,Servlet怎么处理一个请求5,Servlet与JSP有什么区别6,Servlet里的cookie技术7,Servle ...
- Java入门:JDK与Eclipse之类的集成开发工具的关系
JDK是Java Development Kit,也就是说Java开发所需的工具包.有了这个东西,一切Java开发理论上都不是问题了.当然,根据你下载的版本不同,可能擅长的领域不同.通常大家都是用JD ...
- vue全局组件和局部组件
1.全局注册组件 Vue.componet('name',{ template:'<div></div>', data(){ retrun {} } }) 使用了以上这种方式注 ...
- linux diff 命令
diff 命令是 linux上非常重要的工具,用于比较文件的内容,特别是比较两个版本不同的文件以找到改动的地方.diff在命令行中打印每一个行的改动.最新版本的diff还支持二进制文件.diff程序的 ...
- Ubuntu下配置支持Windows访问的Samba共享
一.安装Ubuntu samba服务器 $ sudo apt-get install samba $ sudo apt-get install smbclient # Linux客户端测试用 二.创建 ...
- IE6下面的css调试工具
在开发过程中,代码部分实现之后,就要着手于前台展示部分的界面,公司的美工又是新手,无奈,只有自己慢慢调了,但IE6之前的版本都没有好的调试工具,后来在网上搜索了一个 IE Developer Tool ...