Java基础-二进制以及字符编码简介
Java基础-二进制以及字符编码简介
作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
想必计算机毕业的小伙伴或是从事IT的技术人员都知道数据存储都是以二进制的数字存储到硬盘的。从事开发的兄弟们对二进制估计也再熟悉不过了。但是现实生活中我们都是知其然不知其所以然。这也是我在学习大数据之前对二进制的迷茫,就说Java中关于byte和int两种不同的数据类型吧,byte是字节类型,一个字节等于八个比特位,int是整数型,它占用了四个字节,共计32个比特位。那么你对二进制确定了解的很透彻吗?比如“-1”是如何通过二进制表示的,为什么一个字节的取值范围是“-128~127”,为什么在二进制中“0”是正数?“-128”是如何表示的呢?如果你对这些还没有了解透彻,我们可以一起来探讨一下。
一.计算机只能识别“0”和“1”
在计算机中,所有的数据都是以“0”和“1”的形式存在的,比如CPU,内存,硬盘中的数据都是“0”和“1”。话句话说,计算机只能识别“0”和“1”,因为计算机是由数字逻辑电路设计成的,电路只有通电和断电两种稳定的状态,就用“0”和“1”来表示这两种状态。
在计算机中存储一个“0”或“1”,需要使用一个比特位(bit),一个字节(byte)字节表示8个二进制位。做大数据的小伙伴,电脑的标配内存建议是32G,你们32Gbyte是多少字节呢?(32GByte = 32*1024Mbyte = 32*1024*1024Kbyte = 32*1024*1024*1024Byte)。
二.简介二进制
1>.什么是二进制
二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”,借位规则是“借一当二”,由18世纪德国数理哲学大师莱布尼兹发现。当前的计算机系统使用的基本上是二进制系统,数据在计算机中主要是以补码的形式存储的。计算机中的二进制则是一个非常微小的开关,用“开”来表示1,“关”来表示0。
2>.如何用二进制表示数字“8”

综上图:我们可以看出数字“8”用二进制表示为:“00001000”。
3>.如何用二进制表示数字“-8”
Java的负数采用补码方式存储,即:取反+1。我们知道正数“8”用二进制表示应为:“00001000”,如果对其取反则为:“10000111”,我们如果在对他进行加“1”操作后的数字应为:“10001000”,所以我们说“-8”用二进制表示则为:"10001000",那么问题来了,“8”和“-8”的相加的和应该是多少呢?相信大家都是心知肚明的,那么我们看看计算机是如何用二进制表示的吧。

如上图所示:数字“8”和“-8”的相加的和为:“100000000”,很显然,一个字节只能存储8位,所以,我们要把最前面的那个“1”丢弃掉,这样就得到了“00000000”,即8个“0”,因此,“8”+“-8”的值为“0”。现在想想发明二进制算法的人真是牛逼啊!连这样的空隙都想出来了!!
4>.小试牛刀-int和byte类型强制转换

其实原理很简单,byte类型只有8个bits,最大的值为“-128~127”,其结果如下:

三.字符编码
字符编码可以把我们输入的汉字等字符转换为对应的“01”序列,还可以把“01”序列转换为对应的字符。
1>.编码
把字符转换成对应的码值。
2>.解码
把一个整数转换为对应的字符。
3>.常用的字符编码
a>.ASCII 编码,美国的标准的信息转换码,仅使用一个字节存储;
b>.ISO-9959-1 编码,西欧编码,Tomcat服务器默认的编码格式;
c>.GBK(一个汉字对应2个字节)/GB2312编码,简体中文编码,每个汉字都对应两个字节的“01”序列;
d>.BIG5(一个汉字对应2个字节),繁体中文编码;
e>.Unicode 编码,为全世界所有的语言都提供了唯一的编码,有utf-8(一个汉字对应3个字节),utf-16等常用的编码格式。
f>.UTF-8编码,国际化统一编码,可以表示任何文字。
注意:任何字符集都是ASCII编码的超集。
4>.乱码
编码时使用的编码格式与解码时使用的解码格式不一致就会出现乱码。如"尹正杰"三个汉字使用utf-8编码,生成“01”序列为9个字节,如果是用GB2312进行解码,把两个字节的“01”序列翻译为一个汉字,最终解码出来的数据肯定是不正常的。现在你应该明白为什么你下载了一个晚上的小电影,最后用播放器打开的时候提示无法渲染该文件内容,这就是因为播放器不支持你所下载的视频格式。
5>.小试牛刀
a>.打印出Java中char可以表示的类型
/*
@author :yinzhengjie
Blog:http://www.cnblogs.com/yinzhengjie/tag/Java%E5%9F%BA%E7%A1%80/
EMAIL:y1053419035@qq.com
*/ package cn.org.yinzhengjie.java; import org.junit.Test; public class CharacterCoding {
//打印出Java中char可以表示的类型
@Test
public void testChar(){
int count = 0;
for (int i = 0x0000;i <= 0xffff;i++){
char res = (char)i;
if (count == 20){
count = 0;
System.out.println();
}
System.out.print(i + ":" + res + " ");
count++;
}
}
}
b>.对“尹正杰”这个字符串进程编码和解码操作
/*
@author :yinzhengjie
Blog:http://www.cnblogs.com/yinzhengjie/tag/Java%E5%9F%BA%E7%A1%80/
EMAIL:y1053419035@qq.com
*/ package cn.org.yinzhengjie.java; import org.junit.Test;
import java.nio.charset.Charset; public class CharacterCoding {
@Test
public void testCharset() throws Exception {
String str = "尹正杰" ;
//编码
System.out.println(Charset.defaultCharset().name()); //查看当前操作平台默认的编码格式
byte[] bytes = str.getBytes("unicode") ; //编码的格式以Unicode进行编码 //解码
String str2 = new String(bytes, "unicode") ; //解码的格式以Unicode的方式进行解码
System.out.println(str2);
}
}
c>.找出“尹正杰”这个字符串在Unicode存储的编号
/*
@author :yinzhengjie
Blog:http://www.cnblogs.com/yinzhengjie/tag/Java%E5%9F%BA%E7%A1%80/
EMAIL:y1053419035@qq.com
*/ package cn.org.yinzhengjie.java; import org.junit.Test; public class CharacterCoding { //找出“尹正杰”对应的unicode编号,不推荐使用!效率低!
@Test
public void searchName(){
for(int i = 0x0000;i<0xffff;i++){
char res = (char)i;
if (res == '尹' || res == '正' || res == '杰'){
System.out.print(i + ":" + res + " ");
}
}
}
//找出“尹正杰”对应的unicode编号,推荐使用!
@Test
public void searchName2(){
int yin = '尹';
int zheng = '正';
int jie = '杰';
System.out.println(yin);
System.out.println(zheng);
System.out.println(jie);
}
}
d>.定义函数,取出整数内存中的存储形态对应的16进制字符串。
/*
@author :yinzhengjie
Blog:http://www.cnblogs.com/yinzhengjie/tag/Java%E5%9F%BA%E7%A1%80/
EMAIL:y1053419035@qq.com
*/ package cn.org.yinzhengjie.java; public class CharacterCoding {
/**
* 定义函数,取出整数内存中的存储形态对应的16进制字符串。
*/
public static String int2hexStr(int j){
StringBuffer buffer = new StringBuffer();
char[] chars = {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F',};
for (int i = 0;i<8;i++){
//每次移动不同的位数,然后和0x0f进行“&”运算,目的是为了把前28位的数字都变成0,只截移位后的最后4位,而这最后4位的取值范围恰巧在chars数组中!
char c = chars[j>>(i * 4) & 0x0f];
//每次取值后,将该数据插入到首位
buffer.insert(0,c);
}
return buffer.toString();
} public static void main(String[] args) {
int year = 2018;
String res = int2hexStr(year);
System.out.println(res);
}
} /*
以上代码执行结果如下:
000007E2
*/
e>.定义函数,取出整数内存中的存储形态对应的2进制字符串。
/*
@author :yinzhengjie
Blog:http://www.cnblogs.com/yinzhengjie/tag/Java%E5%9F%BA%E7%A1%80/
EMAIL:y1053419035@qq.com
*/ package cn.org.yinzhengjie.java; public class CharacterCoding {
/**
* 定义函数,取出整数内存中的存储形态对应的2进制字符串。
*/
public static String int2BinaryStr(int j){
StringBuffer buffer = new StringBuffer();
char[] chars = {'0','1'};
for (int i = 0;i<32;i++){
char c = chars[j>>(i * 1) & 0x01];
//每次取值后,将该数据插入到首位
buffer.insert(0,c);
}
return buffer.toString();
} public static void main(String[] args) {
int year = 2018;
String res = int2BinaryStr(year);
System.out.println(res);
}
} /*
以上代码输出结果如下:
00000000000000000000011111100010
*/
Java基础-二进制以及字符编码简介的更多相关文章
- 字符编码简介:ASCII,Unicode,UTF-8,GB2312
字符编码简介:ASCII,Unicode,UTF-8,GB2312 1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和 1两种状态,因 ...
- 转载:字符编码简介 ASCII UTF-8 ISO8859-1
字符编码简介 ASCII UTF-8 ISO8859-1 博客分类: 电脑综合知识 XP数据结构Windows 计算机中的一切都是以数字来表示的,字符同样如此.字符编码就是将字符集编码成为数字序列, ...
- 001. Java内存中的字符编码
Java内存中的字符编码 Unicode字符集及utf-8 .utf-16.utf-32 等字符编码方式 字符集:字符表示的数字集合,元素称为码点或码位: 字符编码:字符实际的储存表示: 码点:一个码 ...
- Java基础-日期格式化DateFormat类简介
Java基础-日期格式化DateFormat类简介 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.DateFormat类概述 DateFormat 是日期/时间格式化子类的抽象 ...
- Python编程笔记二进制、字符编码、数据类型
Python编程笔记二进制.字符编码.数据类型 一.二进制 bin() 在python中可以用bin()内置函数获取一个十进制的数的二进制 计算机容量单位 8bit = 1 bytes 字节,最小的存 ...
- Python基础编程:字符编码、数据类型、列表
目录: python简介 字符编码介绍 数据类型 一.Python简介 Python的创始人为Guido van Rossum.1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心 ...
- Java中常用的字符编码-解析
ASCII字符编码 美国信息互换标准代码,为罗马字母编制的一套编码,主要用于表达现代英语和其他西欧语言中的字符,1字节的7位表示一个字符. ISO-8859-1字符编码 ISO为西欧语言中的字符制定的 ...
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
什么是字符编码? 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255( ...
- [十]基础数据类型之Unicode编码简介
编码含义 关于编码的含义,之前也说过,计算机只能存储二进制序列 所以对于字符,保存的时候,需要进行编码为二进制,进行存储 呈现的时候,需要将二进制进行解码,转换成字符的形式 有很多种编码方式,比如 ...
随机推荐
- Codeforces 948D Perfect Security(字典树)
题目链接:Perfect Security 题意:给出N个数代表密码,再给出N个数代表key.现在要将key组排序,使key组和密码组的亦或所形成的组字典序最小. 题解:要使密码组里面每个数都找到能使 ...
- Codeforces 950D A Leapfrog in the Array (思维)
题目链接:A Leapfrog in the Array 题意:给出1-n的n个数,从小到大每隔一个位置放一个数.现在从大到小把数往前移动,每次把最右边的数移动最靠右边的空格处直到n个数都在前n个位置 ...
- Android Studio Xposed模块编写(一)
1.环境说明 本文主要参考https://my.oschina.net/wisedream/blog/471292?fromerr=rNPFQidG的内容,自己实现了一遍,侵权请告知 已经安装xpos ...
- phpmyadmin连接MySQL服务器被拒绝
显示: phpMyAdmin 尝试连接到MySQL服务器,但服务器拒绝连接.您应该检查配置文件中的主机.用户名和密码,并确认这些信息与 MySQL 服务器管理员所给出的信息一致. 原因: 可能是修改了 ...
- OpenCV学习资源库
整理了我所了解的有关OpenCV的学习笔记.原理分析.使用例程等相关的博文.排序不分先后,随机整理的.如果有好的资源,也欢迎介绍和分享. 1:OpenCV学习笔记 作者:CSDN数量:55篇博文网址: ...
- OpenGL学习(2)——绘制三角形
在创建窗口的基础上,添加代码实现三角形的绘制. 声明和定义变量 在屏幕上绘制一个三角形需要的变量有: 三角形的三个顶点坐标: Vertex Buffer Object 将顶点数据存储在GPU的内存中: ...
- 关于UNITY学习,给新生建议
没有不可能,只有不努力. 本人自学UNITY,实力不敢称最好,但绝对不是小白,自己独立做出过游戏,AR.(用C#) 1. 导入模型一定要注意坐标,否则会很麻烦.本人因为这个吃了很多盐 2. 学unit ...
- PAT甲题题解-1035. Password (20)-水
题意:给n个用户名和密码,把密码中的1改为@,0改为%,l改为L,O改为o. 让你输出需要修改密码的用户名个数,以及对应的用户名和密码,按输入的顺序.如果没有用户需要修改,则输出对应的语句,注意单复数 ...
- 四则运算 SPEC 20160911
本文档随时可能修改,并且没有另行通知. 请确保每一次在开始修改你的代码前,读标题中的日期,如果晚于你上次阅读, 请重读一次. 教师节你去探望初中数学老师,她感叹你当年真是个优秀学生啊,从来不报怨作 业 ...
- 2-Fifteenth Scrum Meeting-20151215
任务安排 成员 今日完成 明日任务 闫昊 修复bug 写完学习进度记录的数据库操作 唐彬 编写与服务器交互的代码 编写与服务器交互的代码 史烨轩 获取视频url 余帆 修复bug 本地路径的 ...