如果觉得此地排版不好,欢迎访问我的博客

浅显总结ASCII Unicode UTF-8的区别

制作表单时,为了追求更好的用户交互体验,常常会有提示性的内容,比如提醒用户字符的限制。由于英文,中文字符的问题,涉及到编码的转换调整。

ASCII码

计算机的早期使用者大多使用英文,而计算机则以二进制来储存;ASCII规定128个英文字符与二进制的对应关系,通常占据一个字节。ASCII编码包括大写英文,小写英文,英文符号等256个字符。

Unicode编码

随着计算机的普及,各个国家都使用,原来的只限于英文的ASCII码不够用,90年代重新制定Unicode编码,也称为统一码,万国码。Unicode字符集 覆盖了所有的字符,为每个字符进行统一编号,分配唯一的字符码

UTF-8

UTF-8是一种编码方式,其他的编码方式譬如:UTF-16等等,用UTF-8为了将Unicode里面的英文字符为1个字节,其他不常见的字符(中日韩文等)用2-4个字节,主要为了减少文件大小,方便文件的传输。

关系

总的来说,ASCII码是英文专属;Unicode码是ASCII码的拓展,即任何语言通用;UTF-8则是对Unicode码的编码方式。

ASCII码和Unicode码都是字符集,不同的是ASCII码和具体的编码方案绑定一起,而Unicode码则与具体的编码方法隔离开,即UTF-8是最为普遍的Unicode编码方案。这样,所谓ASCII码也就成为UTF-8的一部分了。

虽然每个字符在Unicode字符集中都能找到唯一确定的编号,但决定最终字节流的是具体的字符编码(即编码方案是怎么样的)。

一些术语

字符集 (charset set):字符的集合,已编号的字符有序的集合

字符码 (code point):字符集中每个字符的数字编码,比如:GBK字符集使用区位码的方式为每个字符编号,定义94*94的矩形,每个汉字放入矩形中,‘中’字放在54区第48位。字符码就是5448

编码 :将字符串转换为字节流

解码 :将字节流解析为字符

字符编码 (character encoding):将字符集中的字符码映射为字节流的一种具体实现方案

计算机字符编码工作方式

计算机内存中,统一使用Unicode编码,当保存到硬盘或传输时,就转换为UTF-8编码

记事本编辑时候,从文件读取UTF-8字符被转换为Unicode字符到内存,保存时则将Unicode转为UTF-8保存到文件

浏览网页时候,服务器把动态生成的Unicode内容转换为UTF-8再传输到浏览器

表单验证

  function getLength(str){                   //利用字符串replace方法和正则解决非英文长度问题
return str.replace(/[^\x00-\xff]/g,'xx').length //匹配超过ASCII码的字符,用16进制表示的
}

function length(){
var len=0;
for(var i=0;i<text.value.length;i++){ //str.charCodeAt()返回的是ASCII码
if(text.value[i].charCodeAt()<0||text.value[i].charCodeAt()>255){
len+=2
}else{
len++
}
}
}

参考资料

  1. https://www.zhihu.com/question/23374078

  2. https://www.cnblogs.com/yuguangchuan/p/4310952.html

  3. http://www.imkevinyang.com/2010/06/%E5%85%B3%E4%BA%8E%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81%EF%BC%8C%E4%BD%A0%E6%89%80%E9%9C%80%E8%A6%81%E7%9F%A5%E9%81%93%E7%9A%84.html

浅显总结ASCII Unicode UTF-8的区别的更多相关文章

  1. ASCII UNICODE UTF "口水文"

    最近接了一个单是需要把非 UTF-8 (No BOM)编码的文件转换成 UTF-8 (No BOM),若此文件是 UTF-8 但带有 BOM ,需要转换成不带 BOM 的.于是开启了一天的阅读.首先花 ...

  2. 浅谈ASCII 、ISO8859-1、GB2312、GBK、Unicode、UTF-8 的区别。

    浅谈ASCII .ISO8859-1.GB2312.GBK.Unicode.UTF-8 的区别. 首先,先科普一下什么是字符编码.字符是指一种语言中使用的基本实体,比如英文中的26个英文字母,标点符号 ...

  3. unicode编码与utf-8 区别

    unicode编码与utf-8 区别 如果是为了跨平台兼容性,只需要知道,在 Windows 记事本的语境中: 所谓的「ANSI」指的是对应当前系统 locale 的遗留(legacy)编码.[1] ...

  4. AJPFX解析关于编码ansi、GB2312、unicode与utf-8的区别

    大家平时遇到乱码问题是否有自己的一套解决方案?这篇文章就是介绍一下常用的编码方式关于编码ansi.GB2312.unicode与utf-8的区别 先做一个小小的试验: 在一个文件夹里,把一个txt文本 ...

  5. Unicode(UTF&UCS)深度历险

    Unicode(UTF&UCS)深度历险 计算机网络诞生后,大家慢慢地发现一个问题:一个字节放不下一个字符了!因为需要交流,本地化的文字需要能够被支持. 最初的字符集使用7bit来存储字符,因 ...

  6. 从字符集发展史看Unicode和UTF-8的区别

    从字符集发展史看Unicode和UTF-8的区别 版权声明 本文并非本人原创,其内容来源于网络,本文根据其演绎而来,具体出出已经无法考证,在这里只好给出我所参考的连接. 知乎 https://www. ...

  7. 字符编码 ASCII,Unicode和UTF-8的关系

    转自:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143166410626 ...

  8. 字符编码 ASCII unicode UTF-8

    字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(b ...

  9. Python2.7 中文字符编码 & Pycharm utf-8设置、Unicode与utf-8的区别

    Python2.7 中文字符编码 & Pycharm utf-8设置.Unicode与utf-8的区别 zoerywzhou@163.com http://www.cnblogs.com/sw ...

随机推荐

  1. 小白的Python之路 day5 configparser模块的特点和用法

    configparser模块的特点和用法 一.概述 主要用于生成和修改常见配置文件,当前模块的名称在 python 3.x 版本中变更为 configparser.在python2.x版本中为Conf ...

  2. 十二个 ASP.NET Core 例子——过滤器

    目录: 过滤器介绍 过滤器类别 自定义过滤器和过滤特性 直接短路返回内容 过滤器与中间件的区别 如果要全局日志,不要用过滤器 官方文档传送门 1.过滤器介绍 没有权限直接返回,资源缓存,Action执 ...

  3. vue-cli创建的项目中引入第三方库报错 'caller', 'calle', and 'arguments' properties may not be...

    http://blog.csdn.net/sophie_u/article/details/76223978 以在vue中引入mui第三方库为例: 虽然针对vue,有单独的vue-mui库可以使用,但 ...

  4. Django之modelform组件

    一.简介与基本使用 简介:django中的modelform组件同时具有model和form作用,但是耦合度比较高,当项目需要拆分时候就比较困难了,所以在使用modelform时候需要先考虑项目的扩展 ...

  5. Spring切面优先级

    项目中有两个切面,这两个切面都作用于同一个方法,哪个先执行哪个后执行呢,所以要定义一个切面的优先级 import java.util.Arrays; import org.aspectj.lang.J ...

  6. linux_nginx反向代理

    什么代理? 代理他人工作 什么是正向代理和反向向代理,他们之间的区别? 这两个代理很类似,但扮演了两个不同角色,一个站在用户角度,一个站在服务端角度 正向代理: 帮助用户请求服务 返向代理:帮助服务均 ...

  7. jquery判断数据类型和相同字符串不相等

    typeof object返回object对象数据类型 encodeURIComponent(str)//可把字符串作为URI 组件进行编码. 若str1和str2字符串数值相同,encodeURIC ...

  8. 通过反编译深入理解Java String及intern(转)

    通过反编译深入理解Java String及intern 原文传送门:http://www.cnblogs.com/paddix/p/5326863.html 一.字符串问题 字符串在我们平时的编码工作 ...

  9. maven(项目管理工具系列 maven 总结二)

    ♣maven是什么? ♣maven下载.安装 ♣了解maven仓库 ♣eclipse配置maven ♣创建maven项目 ♣把maven项目转化为web项目 1.maven是什么? Maven是一个项 ...

  10. Hibernate (四)

    1 懒加载 (感觉用处不是很大) 需要的时候加载,不需要的时候就不加载. 1.1 环境的搭建 hibernate.cfg.xml <?xml version='1.0' encoding='ut ...