百度百科 ASCII码:http://baike.baidu.com/link?url=bNtzytBhlSUt_l3pwpfICxCxqgAfqsBMaeWX6QF7gH46Tg4pQtKM2aAVZS7r_DmPCdHDG5huHmr9NFqTK3_ZDlVWyIDcjUI2Ai0Tc3VstV9wgXg_c50ZO2uOyrA3PDjpuwBQ_UegvchzO3WyDXuWmK 中文名美国信息交换标准代码 外文名American Standard Code for Information…
第一阶段 盘古开天辟地——ASCII码 计算机大家都知道,本质是二进制运算和存储.在计算机中人类的几乎所有文字和字符都没法直接表示,所以美国人在发明计算机的时候为了让计算机可以用于保存和传输文字,就发明了ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),用128个数字分别映射到美国人常用的一些字符,包括阿拉伯数字和26个英文字母的大小写,以及其他一些常用的符号.一个字符占用7位二进制,用一个字节byte(8…
字符编码的发展历史 Unicode和UTF-8有何区别? 在这个问题下的于洋的最高票回答中,比较完整地介绍了字符编码的发展历史,为了便于记忆,再次简要概括一番. 一个字节:最初一个字节的标准是混乱的,出现过4位.6位.7位的一字节标准,最终由于历史原因和物理存储需求(8位是2的3次方,方便物理存储),所以采用了8位为一个字节的标准. ASCII:定下了8位为一个字节后,那么一个字节可以表示的状态就有256种(2^8),对应0-255号.接下来就需要考虑8位如何表示一个字符了,ASCII码顾名思义…
几乎很少写JAVA代码,第一是确实不会,第二感觉JAVA写起来不爽(较python.golang),但总有万不得已必须要用java的时候.这里记录下使用java实现的hex十六进制和acsii码之间的转换(代码主要还是从网上找来的,简单改吧改吧). 一.ASCII to Hex 这里是将ascii码转换为十六进制值,代码如下: private static String asciiToHex(String asciiStr) { char[] chars = asciiStr.toCharArr…
对之前的字符串类型和二进制类型(bytes类型),可以这样关联记忆,把字符串类型当作是Unicode,把bytes类型当作是GBK或者UTF-8或者是日文编码.这样字符串要转成二进制,那么就需要编码encode,二进制要转成字符串就需要解码decode. 在python3里,所有的字符默认编码是Unicode,在python2里,所有字符默认是Ascii. 只有加了如下代码,才表示默认编码是啥: #-*- coding:utf-8 -*- 下面所有的代码都在python2.7下运行的结果: 在S…
1 ASCII码 统一规定英语字符与二进制位之间的关系.ASCII码一共规定了128个字符的编码.例如,空格“SPACE”是32(二进制00100000),大写字母A是65(二进制01000001).这128个符号(包括32个不能打印出来的控制符号)只占用了一个字节的后面7位,最前面的1位统一规定为0. 2 非ASCII编码 表示非英语的其他语言时,128个符号是不够的.例如,在法语中,字母上方有注音符号,无法用ASCII码表示.于是,一些欧洲国家就决定:利用字节中闲置的最高位编入新的符号.例如…
二-十进制码(BCD码) 在目前的数字系统中,一般是采用二进制数进行运算的,但是由于人们习惯采用十进制数,因此常需进行十进制数和二进制数之间的转换,其转换方法上面已讨论过了.为了便于数字系统处理十进制数,经常还采用编码的方法,即以若干位二进制码来表示1位十进制数,这种代码称为二进制编码的十进制数,简称二-十进制码,或BCD码(Binary Coded Decimal Codes). 因为十进制数有0-9共10个计数符号,为了表示这10个符号中的某一个,至少需要4位二进制码.4位二进制码有24=1…
Java中有三种表示整数的方法:十进制.八进制.十六进制. 八进制:以0开头,包括0~7的数字.如:int octal=020;  //定义int型变量存放八进制数据 十六进制:以0x或0X开头,包括0~9的数字及字母a~f,A~F.如:long hex=0xf932d763fae4325L;  //定义长整型变量存放十六进制数据 不同的编码方式按照它们的规定方法将支持的字符集转换为计算机硬件进行能操作的二进制形式,其中包括了一些格式转换过程. ASCII(American Standard C…
GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:gb2312: high8 = 0xa1-->0xfe (161 - 254)low8 = 0xa1-->0xfe  (161 - 254) gbk: high8 = 0x80-->0xfe (128 - 254)low8 = 0x40-->0xfe (64 - 254) GB2312和GBK的区别:http://zhidao.baidu.com/question/40269499 汉字ASCII对照…
8位一个字节  1024字节 1KB   1024KB 1MB ASCII码不能包含中文.创建了unicode,一个中文4个字节.UTF-8一个中文3个.GBK中国人用的只包含中文2个字节 升级 Unicode 一个中文用3个字节表示 python2打印中文出错  默认不包含中文   编码方式用UTF-8表示中文. 中文 英文 日语 韩语 UTF-8是 unicode 的升级版   UTF-8一个中文用3个字节表示: GBK 国内使用 一个中文用2个字节…