ASCII-->Ansi-->Unicode-->UTF8 关于编码自己的总结

各种不同的编码无非就是效率最大化。

我猜测编码的进化流程：

ASCII（American Standard Code for Information Interchange）----满足了美国和西方国家。但是只能传输英文。------->>>

Ansi（American National Standards Institute）------后来各个国家眼热为了自己的安全，因为要战争吗，设计了自己的一套。可以传输英文和本土语言------->>>

Unicode（Universal code 也可以称UTF-16）-------------后来不打仗了，各个国家要合作共赢，于是国际组织设计了一套包容全球语言的编码，这种编码的最小字节是2个字节，具体哪个国家的语言再前，哪个国家再后，要看这个国家的实力了，非洲没实力，所以只能靠后排，那么就会导致一个非洲英文字母a 都需要4个字节，操蛋。那个时候的中国有点实力还好，大多数常用中文70%只占2个字节，不常用的（30%）占3个字节------------>>>

UTF-8（8-bit Unicode Transformation Format）-------unicode的设计目的是为了用一种设计方式，兼容全球语言，方便全球通信，但是设计的时候，我猜测有过争执，到底最小字节是1还是2呢。这个是没有答案的，看对谁有利了。如果最小用一个字节则对西方国家有利。如果最小用2个字节则对除了西方国家的其它国家都有利。举例：东方国家中国日本韩国非洲国家中东地区的国家等等。unicode 即UTF-16 用最小2个字节是一种适中的方法，就是说牺牲一点西方国家但是能兼顾到很多国家。就这西方国家不满意了，毕竟西方国家是贪婪的资本主义。他们认为不应该牺牲他们来兼顾更多的国家。于是他们又发明了或者说 unicode的另一种表达方式用最小1个字节开始来表达。这样对西方国家就有利。因为英文只占一个字节，但是对其它国家都不利，因为会导致其它国家的排序更靠后。比如中文UTF-8下 50%的中文占两个字节，30%占3个字节，20%占4个字节。

所以根据情况来选择了，如果你是西方国家不想走向国际的话就只用 ascii就行 1个字节。如果要走向国际有两种选择要么UTF-8 要么UNICODE，如果你以本土为主其它国家为辅可以UTF-8，如果以其它国家为主

可以UNICODE。

如果你是东方国家比如中国，不想走向国际挣很多国家的钱的话可以用ansi 即GBK 最节省资源。如果你要走向国际要么UTF-8 要么UNICODE ，中国人口多中国为主的话可以 UNICODE 西方为主的话可以 UTF-8.

凡事有利有弊，自己根据情况酌情选择。

到点了得赶紧回去吃饭了。

ASCII-->Ansi-->Unicode-->UTF8 关于编码自己的总结的更多相关文章

各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK)
一直对字符的各种编码方式懵懵懂懂,什么ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们.Let's go! ...
【转】Unicode utf8等编码类型的原理
原文地址http://www.cnblogs.com/daxiong2014/p/4768681.html Unicode utf8等编码类型的原理 1.ASCII码我们知道,在计算机内部,所有的 ...
编码 ASCII, GBK, Unicode+utf-8
0. 1.参考网页编码就是那点事阮一峰字符编码笔记:ASCII,Unicode 和 UTF-8 2.总结美国 ASCII 码发音: /ˈæski/ :128个字符,只占用了一个字节的后面7位 ...
ascii unicode utf-8 url编码
ascii 编码计算机内部,所有信息最终都是一个二进制值上个世纪60年代,美国制定了一套字符编码ascii ascii 编码就是定义:英语字符与二进制位之间的关系 unixcs unicode编码 ...
[转]Unicode utf8等编码类型的原理
FROM:http://www.cnblogs.com/daxiong2014/p/4768681.html 1.ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进 ...
字符编解码的故事(ASCII,GBK,Unicode,Utf-8区别)
很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们认为8个开关状态作为原子单位很好,于是他们把这称为"字节". 再后来,他们又做了一 ...
Unicode utf8等编码类型的原理
1.ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte). ...
[转]Python的ASCII, GB2312, Unicode , UTF-8
2007-12-13 10:50:47| 分类: Python实用软件编|举报|字号订阅 ASCII 是一种字符集,包括大小写的英文字母.数字.控制字符等,它用一个字节表示,范围是 0-1 ...
Python的ASCII, GB2312, Unicode , UTF-8 相互转换
ASCII 是一种字符集,包括大小写的英文字母.数字.控制字符等,它用一个字节表示,范围是 0-127 Unicode分为UTF-8和UTF-16.UTF-8变长度的,最多 6 个字节,小于 127 ...
python 保存文本txt格式之总结篇,ANSI,unicode,UTF-8
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAA4wAAAEmCAIAAACmsIlUAAAgAElEQVR4nOydezxU+f/HP49WSstKkZ

随机推荐

【CF666E】Forensic Examination（后缀自动机，线段树合并）
[CF666E]Forensic Examination(后缀自动机,线段树合并) 题面洛谷 CF 翻译: 给定一个串\(S\)和若干个串\(T_i\) 每次询问\(S[pl..pr]\)在\(T_ ...
【BZOJ】2956：模积和
Time Limit: 10 Sec Memory Limit: 128 MB Description 求∑∑((n mod i)*(m mod j))其中1<=i<=n,1<=j ...
PID控制算法的C语言实现二 PID算法的离散化
上一节中,我论述了PID算法的基本形式,并对其控制过程的实现有了一个简要的说明,通过上一节的总结,基本已经可以明白PID控制的过程.这一节中先继续上一节内容补充说明一下. 1.说明一下反馈控制的原理, ...
Tensorflow BatchNormalization详解：2_使用tf.layers高级函数来构建神经网络
Batch Normalization: 使用tf.layers高级函数来构建神经网络觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献吴恩达deeplearningai课程课程笔 ...
CIFAR10/CIFAR100数据集介绍
CIFAR-10/CIFAR-100数据集解析觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 CIFAR-10/CIFAR-100数据集 CIFAR-10和CIFAR-100被标记 ...
javascript 实现 A-star 寻路算法
在游戏开发中,又一个很常见的需求,就是让一角色从A点走到B点,而我们期望所走的路是最短的,最容易想到的就是两点之间直线最短,我们可以通过勾股定理来求出两点之间的距离,但这个情况只能用于两点之间没有障碍 ...
CF760 C. Pavel and barbecue 简单DFS
LINK 题意:给出n个数,\(a_i\)代表下一步会移动到第\(a_i\)个位置,并继续进行操作,\(b_i\)1代表进行一次翻面操作,要求不管以哪个位置上开始,最后都能满足 1.到达过所有位置 2 ...
[译] man 7 pthreads
NAME pthreads - POSIX threads DESCRIPTION POSIX.1 指定了一组叫做POSIX线程或Pthreads的编程接口(函数,头文件).单 ...
Java 里快如闪电的线程间通讯
这个故事源自一个很简单的想法:创建一个对开发人员友好的.简单轻量的线程间通讯框架,完全不用锁.同步器.信号量.等待和通知,在Java里开发一个轻量.无锁的线程内通讯框架:并且也没有队列.消息.事件或任 ...
网站开发中很有用的几个 jQuery 地图插件
下面提到的 jQuery 地图插件不仅仅是提供一个简便的方式来安装一个地图,如果你想在它们之间选择一个放到你的网站上,那么它们还有更多的额外选项来提供更多更全面的功能.大部分的 jQuery 地图插件 ...

ASCII-->Ansi-->Unicode-->UTF8 关于编码 自己的总结

ASCII-->Ansi-->Unicode-->UTF8 关于编码 自己的总结的更多相关文章

随机推荐

热门专题

ASCII-->Ansi-->Unicode-->UTF8 关于编码自己的总结

ASCII-->Ansi-->Unicode-->UTF8 关于编码自己的总结的更多相关文章