拉丁字符 回忆上次内容
  • 上次回顾了字型编码的进化过程
  • 7-bit 的 点阵字库
  • 终于让 字母、数字、标点 明确了字型
 
 
  • 但是 7-bit 的 ascii中
  • 没有法文字符的位置
 

 
添加图片注释,不超过 140 字(可选)
 
  • 如果扩展位为1
  • 不同的计算机厂商
  • 有各自不同的 扩展方式
 
 
  • 这噩梦
  • 比法语不兼容 更可怕!
  • 这以后 编码就越来越多了
  • 互认对方为乱码
 
  • 法文字符
  • 完全被 不同的字符集
  • 直接 变成乱码
 
 
  • 这可怎么办呢?
那可是法国啊!
  • 法国毕竟 曾是 与英国全球争霸的对手

 
添加图片注释,不超过 140 字(可选)
 
  • 美国 从英国独立 最早靠的
  • 还是 富兰克林来法国
  • 找路易十五要的 军事和经济支持
 
  • 现在美国字符集ascii里面
  • 没有法文字符的位置?
 
 
  • 伤心的法国人 不由得回忆起那场海战
特拉法尔加海战
  • 如果当年法国拿破仑选用富尔顿的火轮船
  • 那特拉法尔加海战会被改写
 
  • 如果 结局改写
  • 美利坚 可能是 法国殖民地
 

 
添加图片注释,不超过 140 字(可选)
 
  • 英国应该 无法和法国 在海上争霸
  • 最终 世界语言是法语
  • 美国 入学考的不是TOEFL
  • 而是 TOFFL
 

 
添加图片注释,不超过 140 字(可选)
 
  • 再往前
  • 英国就更非主流了
 
征服者威廉
  • 法兰克王国 诺曼地区的公爵威廉
  • 跨过英吉利海峡
  • 成了 不列颠岛的征服者威廉
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 不列颠岛 北高南低
  • 挡住北边的冷风
  • 非常 适合生存
  • 从来就 不乏 征服者
 
英伦
  • 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
  • 英格兰岛的名字 来自于 盎格鲁部落
  • 当时昂撒 是 凯尔特人 搬来的救兵
  • 假途灭虢 占了这个南方平坦的宝岛
  • 说 这是我们盎格鲁人的岛
  • England
 
  • 盎格鲁岛人说的语言
  • English
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
  • 从不希望 欧洲大陆出现强大的帝国
  • 那就会 威胁到岛上的安全
 
  • 英国对于 欧洲各国制衡之术
  • 又被后来的美国 学去制衡 整个欧亚大陆
 
  • 不过说到底 所有文化的开局 都是从非洲走出来的
  • 最最开始都是 从无机物 偶然变成 有机物
 
  • 但是 电子信息化到数字化 是一个新的大环境
  • 法文字符 的编码方式 会统一 吗?
 
  • 先回顾 ASCII的基本情况
ascii
  • 目前最熟悉的编码是 ascii编码
  • 包括控制字符、大小写字符、数字、符号
 
  • 字节中 第 1 位 为 0
  • 后 7 位
  • 从0x00-0x7F
 
  • 这里面 没有法文字符
 

 
添加图片注释,不超过 140 字(可选)
 
  • 但如果第 1 位是 1
  • 又会如何呢?
 
尝试输出
  • 找到一个数字 0xa7
  • 找到 数字对应的字符
  • 这是个 章节符号
 

 
添加图片注释,不超过 140 字(可选)
 
  • 也可以形成
  • 一个闭环
 
闭环
  • 这规律
  • 和ascii 一样的
  • 也就是说 这个字节里面除了 ascii 的 128 个字符之外
  • 还可以 有一定的空间
  • 还可以 对应更多字符
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 等于是 把ascii编码 给扩展了
编码格式
  • 跨国跨语言的事情 怎么办?
  • 还是要 看用户数量
 

 
添加图片注释,不超过 140 字(可选)
 
  • Dec公司的 VT100
  • 质量 过硬
  • 价格 实惠
  • 终成 新一代机皇
 
机皇的影响力
  • 新的终端
  • 就必须兼容VT100
  • 包括VT100中 一项新功能
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这CSI
  • 不就是 控制序列\e 吗?
 
事实上的标准
  • VT100 是当时 最流行的终端
  • 不但支持 常用的转义字符
  • 还创造出 VT100控制码
 
\033[0m // 关闭所有属性 \033[1m // 设置为高亮 \033[4m // 下划线 \033[5m // 闪烁 \033[7m // 反显 \033[8m // 消隐 \033[nA // 光标上移 n 行 \033[nB // 光标下移 n 行 \033[nC // 光标右移 n 行 \033[nD // 光标左移 n 行 \033[y;xH // 设置光标位置 \033[2J // 清屏
  • 这就是 后来CSI的雏形
  • Control Sequence Introducer
 
  • 有了这个 就可以控制
  • 字体
  • 位置
  • 颜色
 
  • 慢慢 DEC的VT100标准
  • 就成了 计算机终端的标准
 
ISO组织
  • 总部在 瑞士日内瓦湖的 ISO组织
  • 负责 跨国跨公司的标准化
  • 在Dec所用 编码格式的基础 上
  • 发展出 iso-8859-1 字符集
 
 
  • 为什么 选择Dec的 编码格式?
  • 因为 VT100是 当时的 一代机皇
  • 用户数量 就是 事实上的标准
 

 
添加图片注释,不超过 140 字(可选)
 
  • 根据 dec公司的 字符集
  • 生成了 扩展ascii字符集(charset)
 
  • 前一半(0-127)
  • 没有动
  • 还是ascii
 
  • 后一半(128-255)
  • 换成了 西欧北欧各国拉丁字符
 
  • 这个 编码
  • 叫做 iso-8859-1
  • 也叫做 latin-1
 
  • latin-1覆盖的 范围如何呢?
覆盖范围
  • 西欧北欧语族都可以覆盖到
  • 拉丁人的罗曼语族(法意西葡)
  • 日耳曼人的日耳曼语族(瑞丹挪德冰)
  • 凯尔特人的盖尔语族(苏爱)
 

 
添加图片注释,不超过 140 字(可选)
latin-1
  • 拉丁语(法意西葡)我们好理解
  • 拉丁正宗
 

 
添加图片注释,不超过 140 字(可选)
 
  • 北欧 这么多国家
  • 为什么 都使用拉丁字符呢?
 
  • 北欧 不是有 自己的一套符文系统吗?

 
添加图片注释,不超过 140 字(可选)
 
  • 日耳曼语族 不是和 拉丁语族 并列的吗?
总结
  • 这次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域
 
  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1
 

 
添加图片注释,不超过 140 字(可选)
 


[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin的更多相关文章

  1. Python自动化 【第三篇】:Python基础-集合、文件操作、字符编码与转码、函数

    1.        集合 1.1      特性 集合是一个无序的,不重复的数据组合,主要作用如下: 去重,把一个列表变成集合实现自动去重. set可以看成数学意义上的无序和无重复元素的集合,因此,两 ...

  2. Python基础-字符编码与转码

    ***了解计算机的底层原理*** Python全栈开发之Python基础-字符编码与转码 需知: 1.在python2默认编码是ASCII, python3里默认是utf-8 2.unicode 分为 ...

  3. 小白的Python之路 day2 字符编码和转码

    字符编码和转码 详细文章: http://www.cnblogs.com/yuanchenqi/articles/5956943.html http://www.diveintopython3.net ...

  4. Python字符编码与转码

    字符编码与转码 注: 该图转自 http://www.cnblogs.com/luotianshuai/p/5735051.html. Python2 解码,编码 #Python2 #-*- codi ...

  5. 【python】-- 字符串、字符编码与转码

    字符串 字符串是 Python 中最常用的数据类型.我们可以使用引号('或")来创建字符串. 创建字符串很简单,只要为变量分配一个值即可:访问子字符串,可以使用方括号来截取字符串: var1 ...

  6. Python中字符编码及转码

    python 字符编码及转码 python 默认编码 python 2.X 默认的字符编码是ASCII, 默认的文件编码也是ASCII python 3.X 默认的字符编码是unicode,默认的文件 ...

  7. python基础之 列表、元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码

    本节内容 列表.元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 ...

  8. (Python基础)字符编码与转码

    ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧 ...

  9. python_47_Python2中字符编码与转码

    #python3默认是Unicode,Unicode是万国码,不管中文字符还是英文,所有的每个字符都占2个字节空间,16位 #python2默认是ascii码 #ascii码不能存中文,一个英文只能占 ...

  10. python 字符编码与转码

    一. 字符编码 ASCII: 一个字节,最多能表示255个字符 GB2312(1980年):一共收录了7445个字符,包括6763个汉字和682个其它符号. GBK1.0(1995年):收录了2188 ...

随机推荐

  1. es命令大全,elasticsearch命令详解

    参考链接 Relational DB Elasticsearch 数据库(database) 索引(indices) 表(tables) types 行(rows) documents 字段(colu ...

  2. MFC之多字节和宽字节的总结

    ANSI字符集  所支持的就是多字节的也叫窄字节,类型来说就对应char类型.Unicode字符集 也叫宽字符集 所支持的就是宽字符集,从类型上来说就是 wchar_t类型.gb2312是中国的编码, ...

  3. RocketMQ事务消息源码解析

    RocketMQ提供了事务消息的功能,采用2PC(两阶段协议)+补偿机制(事务回查)的分布式事务功能,通过这种方式能达到分布式事务的最终一致. 一. 概述 半事务消息:指的是发送至broker但是还没 ...

  4. 给师妹写的《Java并发编程之线程池十八问》被表扬啦!

    写在开头     之前给一个大四正在找工作的学妹发了自己总结的关于Java并发中线程池的面试题集,总共18题,将之取名为<Java并发编程之线程池十八问>,今天聊天时受了学妹的夸赞,心里很 ...

  5. vue 实现商品列表的添加、删除,搜索

    大江东去,浪淘尽,千古风流人物.故垒西边,人道是,三国周郎赤壁.乱石穿空,惊涛拍岸,卷起千堆雪.江山如画,一时多少豪杰.遥想公瑾当年,小乔初嫁了,雄姿英发.羽扇纶巾,谈笑间,樯橹灰飞烟灭.故国神游,多 ...

  6. raksmart服务器部署SSL报错:ERR_CERT_COMMON_NAME_INVALID

    背景:raksmart服务器 下篇 部署项目 SSL报错:ERR_CERT_COMMON_NAME_INVALID 安装certbot sudo apt update sudo apt install ...

  7. Excel poi 设置单元格格式 发现不可读内容 已修复的记录: /xl/worksheets/sheet1.xml 部分的问题(巨坑)

    Excel poi 设置单元格格式 发现不可读内容 已修复的记录: /xl/worksheets/sheet1.xml 部分的问题(巨坑) 1.先设置值,后设置样式. 正确的是:先设置样式,后设置值. ...

  8. java8 Lambda 测试示例

    import com.google.gson.Gson; import org.junit.Test; import java.util.Arrays; import java.util.IntSum ...

  9. #PowerBi Superchange PowerBi 数据模型篇(1)

    在过去,业务人员通常不熟悉数据建模,因为数据建模往往是专业的IT人员的领域.但是,得益于POWERBI和POWER PIVOT FOR EXCEL ,这样的日子一去不复返了.那么,什么是数据模型呢? ...

  10. uniapp windows 上架 apple store

    香蕉云 蒲公英 ios上架助手iOS Development 开发!先用上架助手在certificates里面生成一个p12文件在profiles里面生成mobileprovision文件就欧克了 需 ...