HTML 中的字符集、ASCII、 ISO-8859-1、符号之间的关系和 HTML URL 编码注意的事项
一、HTML 实体
1.什么是HTML 实体?
在 HTMl 中,某些字符是保留的。小于号 (<) 和 大于号 (>), 浏览器会误认为是标签
如果希望正确地显示预留字符,必须在 HTML 源代码中使用字符实体(HTML entities).
2.字符实体类
&entity_name 或者 &#entity_number;
提示:
使用实体名而不是数字的好处是,名字易于记忆。
不过坏处,浏览器也许并不支持所有实体名称(对实体数字的支持却很好)
3.不间断空格(non-breaking space)
4.HTML 中的常用字符实体体是不间断空格( )
5.HTML 中有用的字符实体
详细地址:http://www.w3school.com.cn/html/html_entities.asp
二、HTMl 字符集
如果正确地显示 HTML 页面,浏览器必须知道使用何种字符集。
1.万维网早起使用的字符集是 ASCII。 ASCII 支持 0-9 的数字,大写和小写英文字母,以及一些特殊字符。
由于很多国际使用的字符并不属于 ASCII,现代浏览器的默认字符集是 ISO-8859-1;
如果网页使用不同于 ISO-8859-1 的字符,就应该在 <meta> 标签进行指定。
2.ISO 字符集
ISO 字符集是国际标准组织(ISO) 针对不同的字母表/语言定义的标准字符集。
3.Unicode 标准
Unicode 的出现就是解决,由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准
Unicode 标准涵盖了世界上的所有字符、标点和符号。不论是何种平台、程序或者语言,Unicode 都能够进行文本数据的处理、存储和交换。
Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF=16.
UTF-8 中的字符可以使 1-4 个字节长。 UTF-8 可以表示 Unicode 标准中的任意字符。 UTF-8 向后兼容 ASCII.
UTF-8 是网页和电子邮箱常用的编码。
注意:所有 HTML 4 处理器均已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16
三、HTML ASCII
HTML 和 XHTML 用标准的 7 比特 ASCII 代码在网络上传输数据。
7 比特 ASCII 代码可以提供 128 个不同的字符值。
四、HTML ISO-88591
HTML 4.01 支持 ISO 8859-1 字符集
ISO 8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 7 比特 ASCII;
ISO 8859-1 的较高部分(从 160 到 255 之间的代码)全部有实体名称。
这些符号中的大多数可以在不进行实体引用的情况下使用,但是实体名称或者实体比编号为那些不容易通过键盘输入的符号提供了表达的方法。
五、HTML 4.01 符号实体
包括了数学符号、希腊字符、各种箭头符号、科技符号以及形状
六、HTMl URL 编码
url 编码形式表示的是 ASCII 字符(十六进制格式)
十六进制格式用于在浏览器和插件中显示非标准的字母和字符。
URL 编码会将字符转换为可通过因特网传输的格式。
URL 统一资源定位器
WEb 浏览器通过 URL 从 web 服务器请求页面
URL 编码
URL 只能使用 ASCII 字符集 来通过因特网进行发送。
由于 URL 常常会包含 ASCII 集合之外的字符, URL 必须转换为有效的 ASCII 格式.
URL 编码使用 %其后跟随两位的 十六进制来代替非 ASCII 字符。
URL 不能包含空格,URL 编码通常使用 "+" 来替换空格。
参考资料:
http://www.oschina.net/translate/what-every-web-developer-must-know-about-url-encoding#Thereservedcharactersarenotwhatyouthinktheyare
http://www.w3schools.com/html/html_entities.asp
http://www.w3school.com.cn/tags/html_ref_language_codes.asp
http://www.w3school.com.cn/html/html_entities.asp
http://en.wikipedia.org/wiki/Percent-encoding
http://blog.csdn.net/wusuopubupt/article/details/8817826
http://blog.163.com/chenzhenhua_007/blog/static/12849264920108119449881/
http://www.qianxingzhem.com/post-1989.html
http://unicode-table.com/en/#cherokee
总结:对 HTMl 基础背景、标准有了初步的了解,还需要在深入的学习。
HTML 中的字符集、ASCII、 ISO-8859-1、符号之间的关系和 HTML URL 编码注意的事项的更多相关文章
- Linux中的文件描述符与打开文件之间的关系
Linux中的文件描述符与打开文件之间的关系 导读 内核(kernel)利用文件描述符(file descriptor)来访问文件.文件描述符是非负整数.打开现存文件或新建文件时,内核会返回一个文件描 ...
- Unity3D 中 Generic 动画导入设置和 Root Motion 之间的关系
2条评论 Unity3D 的 Mecanim 动画系统可以直接复用 3DS MAX 中制作的动画文件中的位移,这个就是通过 applyRootMotion 来达成的,我们只需要在使用 Animator ...
- Linux中的文件描述符与打开文件之间的关系------------每天进步一点点系列
http://blog.csdn.net/cywosp/article/details/38965239 1. 概述 在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件.目录文件. ...
- JavaScript中的 原型 property 构造函数 和实例对象之间的关系
1 为什么要使用原型? /* * javascript当中 原型 prototype 对象 * * */ //首先引入 prototype的意义,为什么要使用这个对象 //先来写一个构造函数的面向对象 ...
- 通俗易懂理清mybatis中SqlSessionSql、SqlSessionTemplate、SessionFactory和SqlSessionFactoryBean之间的关系
我潇洒的灰大狼又回来啦.今天送大家的一句话是: 保持耐心,永远年轻,永远热泪盈眶. 前言 先容我哭一会儿,呜呜呜~昨晚写了一半的文章,还没保存就盖上盖子准备回家,拔下电源准备把电脑塞进书包带回家完成时 ...
- (转)Linux中的文件描述符与打开文件之间的关系
转:http://blog.csdn.net/cywosp/article/details/38965239 1. 概述 在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件.目录文 ...
- 【编码】彻底弄懂ASCII、Unicode、UTF-8之间的关系
计算机中的所有字符,说到底都是用二进制的0.1的排列组合来表示的,因此就需要有一个规范,来枚举规定每个字符对应哪个0.1的排列组合,这样的规范就是字符集. ASCII 全称是“美国信息交换标准码”(A ...
- 数据库中char、varchar、varchar2、nvarchar之间的关系
符串“abc",对于CHAR (20),表示你存储的字符将占20个字节(包括17个空字符),而同样的VARCHAR2 (20)则只占用3个字节的长度,20只是最大值,当你存储的字符小于20时 ...
- 请解释下在单线程模型中Message、Handler、MessageQueue、Looper之间的关系
对于面试,每个职场人士都经历过,面试官更看中你对于技术的理解是否透彻,需要知其所以然,而实际工作中看中的工作效率,都是在使用API的角度来完成任务,当在一家公司呆久了有跳槽的想法时,个人的亲身经历就是 ...
随机推荐
- OpenVPN莫名其妙断线的问题及其解决-confirm
本文很短,目的在于confirm一下凌乱的< OpenVPN莫名其妙断线的问题及其解决>,如果看觉得我比较啰嗦,那么一定要看看最后一个小节,好在CSDN为每篇文章都自动添加了目录,可以直接 ...
- jquery实现表格行的动态增加和删除
$("#Addmaterial").click(function () {//Addmaterial是增加按钮的ID $("#tab tr").attr(&qu ...
- 一个把List<String>转化为以","隔开的字符串的方法
import java.util.ArrayList; import java.util.List; /** * 集合操作 * @author intrl * @date 2010-12-15 * @ ...
- sequence 作为序列插入值不是第一个
CREATE SEQUENCE seq_test INCREMENT BY 1 START WITH 1 ; 创建表时 或执行 ALTER SYSTEM SET deferred_segment_c ...
- Codevs 3729==洛谷P1941 飞扬的小鸟
P1941 飞扬的小鸟 456通过 2.4K提交 题目提供者该用户不存在 标签动态规划2014NOIp提高组 难度提高+/省选- 提交该题 讨论 题解 记录 题目描述 Flappy Bird 是一 ...
- .NE 学习概要
也是个人的学习计划,仅供参考:)
- javascript工具--控制台详解(转自 阮一峰博客)
大神这篇博客是写在2011年,主要介绍 “Firefox” 浏览器插件 “Firebug” 的操作,如今主流浏览器对控制台都已经提供了很好的支持.我自己用的最多是谷歌的 “chrome” 浏览器,下面 ...
- 详解HTML<head> 头标签元素的意义以及使用场景
HTML<head>头部分的标签.元素有很多,涉及到浏览器对网页的渲染,SEO 等等,而各个浏览器内核以及各个国内浏览器厂商都有些自己的标签元素,这就造成了很多差异性.移动互联网时代,he ...
- Unity Rigidbody 刚体中的Angular Drag和Freeze Position/Rotation
Rigidbody中 Angular Drag (角阻力):同样指的是空气阻力,只不过是用来阻碍物体旋转的.如果设置成无限的话,物体会立即停止旋转.如果设置成0,物体在上升过程中,会发生侧翻旋转. ...
- 在Ubuntu中USB连接手机调试
1.打开手机USB调试功能 显示“开发者选项”(开发者选项默认隐藏,一般需要进入到“设置”-->“关于手机”连续点击七次,可将“开发者选项显示出来”) 将“开发者选项”设置为“开启”状态 打开U ...