打包和解包

回忆上次内容

  • decode
  • 就是解码
  • 解码和编码可以转化
  • encode 编码
  • decode 解码
  • 互为逆过程
  • 大小写字母之间序号全都相差(​​32​​)​​10进制​

编辑

  • 这是为什么呢?

差距

  • 大写字母和小写字母
  • 总是相差(​​32​​)​​10进制​

编辑

  • 从10进制角度看不清楚
  • 我们从16进制的角度看看

16进制

  • 正好是(​​0x20​​)​​16进制​

编辑

  • 为什么不多不少
  • 就差 0x20 呢?
  • 怎么那么寸呢?
  • 转化为2进制之后
  • 恰好是1位(bit)
  • 这是偶然的吗?

ASCII 码表趣事

  • 其实最初相差的并不是 0x20
  • 之前 ibm 的 EBCDIC 编码也是这样的

正在上传…重新上传取消

  • 也相差一个2进制位

编辑

  • EBCDIC问题是字母不连续
  • i、j之间不直接相连
  • EBCDIC最终被ascii所淘汰

ASCII

  • ASCII字母是连续的
  • 而且大小写字母间
  • 相差正好是 1个 二进制位
  • 对应 b6 这个位
  • 那为什么要差 1个 二进制位 呢?

编辑

  • 有了这种对应关系之后
  • 做大小写不敏感的字符串查找就快多了
  • 这个 0x20 发生在 1963 年 5 月
  • The X3.2.4 task group voted its approval for the change to ASCII at its May 1963 meeting.
  • Locating the lowercase letters in columns 6 and 7 caused the characters to differ in bit pattern from the upper case by a single bit, which simplified case-insensitive character matching and the construction of keyboards and printers.
  • 当时的目的是
  • 降低大小写不敏感字符串匹配的难度
  • 降低打字机键盘的构造成本
  • 如果搜索中遇到的是小写字母
  • 修改1位之后
  • 小写就都变成大写
  • 不用查找对应关系表匹配
  • 然后再观察全大写的情况下是否匹配
  • 这就是大小写字母的情况
  • ​0x41-0x5A​​这个范围是大写字母
  • ​0x61-0x7A​​这个范围是小写字母
  • 除了大小写字母之外
  • 数字字符又是如何表示的呢?

ASCII 码表范围

编辑

  • ​0x30-0x39​​这个范围是数字
  • 数字的编码减去​​0x30​​正好得到数字本身
  • 后四位刚好是BCD编码模式
  • Binary-Coded Decimal

编辑

  • 我们再来看看 ASCII 除了字母和数字还有什么?

各种符号

  • 各种符号是不连续的

编辑

  • 穿插在数字、字母周围
  • sp 其实就是space(空格)
  • 表格最左边是什么呢?

ASCII

  • ​0x20-0x7F​​ 之间有各种真实字符

编辑

  • ​0x00-0x1F​​ 之间的东西是什么?
  • 前两列都是对应多个字符的
  • 具体含义目前还不知道
  • ASCII中的字符本来英语里就有
  • 但是字符是英文字符、数字和标点
  • 怎么编码的呢?

ASCII由来

  • ASCII码是由电报代码发展而来的

正在上传…重新上传取消

  • 由贝尔数据服务公司推广

编辑

  • 电报码不是摩斯电码吗?

摩斯电码

  • 更早之前确实是摩斯电码
  • 下图是他的编码表
  • 分成长和短两种信号,就是嘀和嗒

编辑

  • 欢迎您有机会来看看oeasy电学、科学史那几个系列
  • 还记得encode/decode中的code么?
  • 曾经一度指的就是各种电报编码汇编
  • 后来统一到摩斯电码

摩斯电码通信规则

  • 下图是他的通信规则
  • 三个断确认本字符结束了
  • 三个断就是字符之间的分隔符
  • 录入状态并不是 0、1 两种状态
  • 而是长、短、暂停三种状态

编辑

  • 编码的原则是什么呢?

效率问题

  • 编码的规则是常用的字符点击次数少
  • 按照字符出现概率分配对应点击数量
  • ​T​​、​​E​​ 出现频率最高
  • 所以用一次点击电键的数量
  • 本质上是一棵霍夫曼树

编辑

  • 当时发射和接收全靠人
  • 什么叫长、什么叫短、什么叫断
  • 发送者控制发报速度
  • 接收者跟着这个发报速度
  • 现查表是来不及的
  • 需要熟悉
  • 摩斯电码码表
  • 常用缩写
  • 这摩斯电码是3进制的编码方式
  • 怎么变成ascii这种0101的二进制编码的呢?

总结

  • ASCII 由这样几类字符构成
  • 英文大写字符
  • 英文小写字符
  • 数字
  • 符号
  • 电报时代对于英文、数字的编码
  • 使用的是摩斯电码

编辑

  • 这摩斯电码是3进制的编码方式
  • 长短空

[oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林的更多相关文章

  1. 判断CString字符串中各位是数字,大小写字母,符号,汉字.xml

    pre{ line-height:1; color:#1e1e1e; background-color:#e9e9ff; font-size:16px;}.sysFunc{color:#627cf6; ...

  2. validate插件:验证密码没有空格 用户名是5-10位 至少包含数字和大小写字母中的两种字符

    //校验密码是否含有空格 jQuery.validator.addMethod("notblank", function(value, element) { var pwdblan ...

  3. 利用C语言识别用户输入字符并且输出该字符ASCII码值(大小写字母篇)(含思路)

    要求:从键盘输入一个字符,如果输入字符的是小写英文字母,则将其转换为大写英文字母,然后将转换后的英文字母及其ASCII码值输出到屏幕上,如果输入的是其他字符,则不转换并且直接将它及其ASCII码值输出 ...

  4. javascript中怎样验证密码是否含有特殊符号、数字、大小写字母,长度是否大于6小于12

    今天在温习了一下以前学过的知识,一般常用验证密码是通过正则表达式或是通过ASCII 一.用AscII码来验证

  5. PowerDesigner的CDM模型将低驼峰命名法则的每个大写字母前加_符

    Option   Explicit ValidationMode   =   True InteractiveMode =   im_Batch Dim   mdl   '当前model '获取当前活 ...

  6. PHP中生成随机字符串,数字+大小写字母随机组合

    简单的生成随机字符串: /* * 生成随机字符串 * * $length 字符串长度 */ function random_str($length) { // 密码字符集,可任意添加你需要的字符 $c ...

  7. https 单向双向认证说明_数字证书, 数字签名, SSL(TLS) , SASL_转

    转自:https 单向双向认证说明_数字证书, 数字签名, SSL(TLS) , SASL 因为项目中要用到TLS + SASL 来做安全认证层. 所以看了一些网上的资料, 这里做一个总结. 1. 首 ...

  8. cb19a_c++_只适合string类型的操作_提取_追加_替换

    *cb19a_c++_只适合string类型的操作_提取_追加_替换三个substr重载函数-获取一个字符串的一部分六个append重载函数-追加字符十个replace重载函数-替换更换 重载函数越多 ...

  9. HTML 限制文本框只能输入特定字符(比如数字 onkeyup+onafterpaste)

    正则表达式1 <td><asp:TextBox ID="TextBox_username" Width="250" runat="s ...

  10. java画图程序_图片用字母画出来_源码发布_版本二

    在上一个版本:java画图程序_图片用字母画出来_源码发布 基础上,增加了图片同比例缩放,使得大像素图片可以很好地显示画在Notepad++中. 项目结构: 运行效果1: 原图:http://imag ...

随机推荐

  1. 阿里云日志服务-Logtail配置

    配置名称: 日志路径: /www/wwwroot/yf/yyyy/application/storage/ /∗∗/ 指定文件夹下所有符合文件名称的文件都会被监控到(包含所有层次的目录),文件名称可以 ...

  2. jQuery——动画加载页面

    <script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.6.0/jquery.js"></script&g ...

  3. docker inspect 格式化输出

    docker inspect 例子 [root@hmm ~]# docker run -tid --name YUN-teSt ubuntu 337170fc3109a824273a7f04dd5c5 ...

  4. vim 多文件编辑

    使用vim打开多个文件 vim可以同时打开好几个文件同时进行编辑 [root@localhost opt]# vim ip.txt time.txt 2 files to edit ens32: fl ...

  5. navicat安装和破解

    navicat16.0 下载地址: https://download.navicat.com.cn/download/navicat160_premium_cs_x64.exe 破解教程&破解 ...

  6. pandas基础--基本功能

    pandas含有是数据分析工作变得更快更简单的高级数据结构和操作工具,是基于numpy构建的. 本章节的代码引入pandas约定为:import pandas as pd,另外import numpy ...

  7. 剑指Offer-64.滑动窗口的最大值(C++/Java)

    题目: 给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值.例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6, ...

  8. fontawesome-webfont.woff:1 Failed to load resource: the server responded with a status of 404 ()

    fontawesome-webfont.woff2:1 Failed to load resource: the server responded with a status of 404 ()fon ...

  9. 【译】Visual Studio 17.10 发布了新版扩展管理器

    我们将更新的扩展管理器带给所有用户!在过去的一年里,我们已经将更新后的扩展管理器作为可选的预览功能提供,并一直期待您的反馈.基于您令人难以置信的反馈,我们现在准备从 Visual Studio 17. ...

  10. TiDB 多集群告警监控-初章-监控融合、自动告警处理

    author:longzhuquan 背景 随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多.虽然每套 TiDB 集群均有 ...