[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化
- 汉字字形通过
- 点阵式打字机
- 像素级寻址的屏幕
- 进入了计算机的世界
- 在海峡对岸的台湾同胞
- 也进入了汉字时代
- 他们会使用GB2312编码吗?
- 能互通吗?
- BIG5 码
- 是由 5 个公司联合制作的
- 收录次序 取决于 频率
- 然后是 笔画数
- 然后是 康熙字典
- 同时用 BIG5 编码和解码也是没有问题的
- 但如果用BIG5编码
- 却用gb2312解码就会有问题
- 不过存储的内容在文件里
- 系统不知道用什么解码时
- 默认自动会用 gb2312 解码
- 这就造成了自动乱码
- 我们用 gb2312 编码的文字
- 用 gb2312 可以打开
- 但是用 BIG5 打开就是乱码
- 也需要转化
- 转化工具是有的
- 能解决问题但很麻烦
- 大量的输入输出编码解码的问题
- 令人头大
- 确实麻烦
- 麻烦的地方正是机会所在
- 当时如果日文游戏或者台湾地区的游戏不能玩
- 可能是因为字符编码格式不一致
- 可以用南极星调整字符编码格式
- 把不同编码格式进行转化
- 把字节按照正确的方式进行解码
- 就可以玩啦
- 没有个标准整合一下吗?
- GBK 即汉字内码扩展规范
- 在GB2312的基础上扩展了繁体字符集
- K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
- 英文全称 Chinese Internal Code Specification
- 最初是微软搞的
- 虽然不是国家标准
- 却是事实上的技术规范
- 共收入 21886 个汉字和图形符号
- GB 2312 中的全部汉字、非汉字符号
- BIG5 中的全部汉字(繁体兼容 GBK1)
- 将 汉字、日本汉字、朝鲜汉字融合了
- 合计 20902 个汉字
- 标准并不是一蹴而就的
- 正如ASA X3.4-1963
- 到 ASA X3.4-1965
- 最终到ascii
- GB也在不断进化
- 从GB/T 1355-86
- 到GB/T 1355-2021
- 这是小麦粉标准的进化
- 从GB2312-1986
- 再到GBK
- 这是中文字符标准的进化
- 但是还是有问题
- GBK虽然兼容了BIG5 中的全部汉字
- 但是无法兼容编码
- 用GBK打开BIG5编码的文件还是乱码
- 如果新GBK兼容了BIG5编码
- 就无法向前兼容gb2312
- 这无解了吗?
- 时间自会给我们答案
- 老天自有安排!
- 中文点阵
- 最小也需要 7x7 像素
- 这个风格很独特
- 字体辨识度
- 1994年的《魔兽争霸》
- 像素字体在RGB显卡的支持下
- 字体不但可以有衬线
- 而且可以有立体感
- 配色也很细腻
- 智冠公司出品的《三国演义》
- 使用隶书和车马符号
- 代表那个三国时代
- 当时的wps系统
- 当时还没有所见即所得
- 使用一些编辑标记
- 制作富文本
- 只有打印预览才能查看效果
- 还可以做艺术字特效
- 中国的简体和繁体汉字
- 字符数量都超级大
- 彼此还认对方为乱码
- 如果有一种编码 将所有的字符都能编进去就好了
- 中日韩(CJK)
- 简体繁体
- 欧洲各种拼音
- 梵文
- 阿拉伯文
- 等等等都包括进去
- 能有么?
- 我们下次再说!
[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化的更多相关文章
- 搭建私有YUM仓库_及_内网镜像站
搭建私有YUM仓库_及_内网镜像站 搭建私有YUM仓库(自己定制的rpm包)私有yum仓库环境系统版本:centos7.4 IP:192.168.1.47 #最好能上公网 私有yum仓库服务端配置 第 ...
- 解决Inno Setup制作中文安装包在非中文系统上显示乱码的问题
尼玛,好几个月没更新了.囧... 目前我司新的客户端开发已经接近尾声,该改的bug已经改完,该重构的地方也都差不多了.视觉效果也已经根据美工的样式改完了.所以,就差制作安装包了.正所谓万事俱备,只欠东 ...
- 用Python爬虫爬取广州大学教务系统的成绩(内网访问)
用Python爬虫爬取广州大学教务系统的成绩(内网访问) 在进行爬取前,首先要了解: 1.什么是CSS选择器? 每一条css样式定义由两部分组成,形式如下: [code] 选择器{样式} [/code ...
- QT字符编码转换,可用于中文内码传输
串口.TCP.UDP传输中文字符时,先将字符串转内码.客户端接收到数据后,将内码转为字符串就OK了 QByteArray CommonFunction::strToInterCode(constQSt ...
- 汉字与区位码互转(天天使用的String存储的是内码),几个常见汉字编码,附有读书笔记
汉=BABA(内码)=-A0A0=2626(区位码)字=D7D6(内码)=-A0A0=5554(区位码) 各种编码查询表:http://bm.kdd.cc/ “啊”字是GB2312之中的第一个汉字,会 ...
- GB2312编码(为什么要加2020H、8080H,外码→内码→交换码→字形码)
为什么要加上2020H和8080H? 区位码.内码.国标码怎么转换非常简单,但是令人迷惑的是为什么要那么转换?这种转换不可能平白无故地那样转换! 我搜索很多资料,找到最好的解释,总结如下: 首先,注意 ...
- 汉字与区位码互转(天天使用Delphi的String存储的是内码,Windows记事本存储的文件也是内码),几个常见汉字的各种编码,utf8与unicode的编码在线查询,附有读书笔记 good
汉=BABA(内码)=-A0A0=2626(区位码)字=D7D6(内码)=-A0A0=5554(区位码) 各种编码查询表:http://bm.kdd.cc/ 汉(记住它,以后碰到内存里的数值,就会有敏 ...
- STM32时钟系统的配置寄存器和源码分析
一.时钟系统 概述 时钟是单片机运行的基础,时钟信号推动单片机内各个部分执行相应的指令,时钟系统就是CPU的脉搏,决定cpu速率. STM32有多个时钟来源的选择,为什么 STM32 要有多个时钟源呢 ...
- 基于双向BiLstm神经网络的中文分词详解及源码
基于双向BiLstm神经网络的中文分词详解及源码 基于双向BiLstm神经网络的中文分词详解及源码 1 标注序列 2 训练网络 3 Viterbi算法求解最优路径 4 keras代码讲解 最后 源代码 ...
- Slurm任务调度系统部署和测试(源码)(1)
1. 概述1.1 节点信息2. 节点准备3. 部署NTP服务器4. 部署LDAP服务器5. 部署Munge认证服务6. 部署Mysql数据库服务7. 部署slurm7.1 创建slurm用户7.2 挂 ...
随机推荐
- 2024 CISCN WEB 部分wp
前言 第二天的revenge真是绷不住,出的很好,下次多出点revenge. ezjava 简要介绍 sqlite jdbc...真的没想到,写文件覆盖写了半天,结果是个CVE...,给的很多东西都是 ...
- 2024盘古石取证比赛(APK)
题目列表 使用软件: Notepad++,火眼证据分析软件,雷电分析app,DB browser for SQLCipher 1. 分析伏季雅的手机检材,手机中诈骗APP的包名是:[答案格式:abc. ...
- latex图片格式问题解决(viso转PDF转eps)
latex图片格式问题解决(viso->PDF->eps) 1.viso绘图 如何让界面自动适应图的大小? 设计->大小->适应绘图 如何将VISIO图转换为PDF? 文件-& ...
- NOIP模拟60
T1 整除 解题思路 答案就是 n 的每一个质因数的合法的答案数相乘(证明的话就....) 但是复杂度显然不允许(虽然我们可以给指数取模水过去).. 可以用积性筛(线性筛)利用质数筛出 \(x^m\) ...
- MySQL学习笔记-多表查询(下)
多表查询(下) 一. 联合查询 联合查询:将多次查询结果合并,形成新的查询结果集 select {字段列表} from {表A} ... union [all] select {字段列表} from ...
- win10离线安装.net3.5失败的解决方案
简介: 问题:有时候需要离线安装.net3.5环境,网上的教程一般都是通过NetFx3.cab进行离线安装,但有时候会出现离线安装失败,比如: by~MaQaQ 2024-06-04 分析: 1.先关 ...
- C基本知识
1 C基本数据类型 C基本的数据类型说明: 2 字节序 测试代码: #include <stdio.h> typedef unsigned char *byte_pointer; void ...
- Linux驱动--IOCTL实现
参考:[Linux]实现设备驱动的ioctl函数_哔哩哔哩_bilibili.<Linux设备驱动程序(中文第三版).pdf> 1 用户空间ioctl 用户空间的ioctl函数原型,参数是 ...
- Qt--ui的简单使用(1)
1 说明 本文主要介绍Qt ui界面的简单使用. 参考视频:https://www.bilibili.com/video/BV1XW411x7NU?p=22 2 工程创建 创建工程时,把创建界面给 ...
- Scrapy框架(九)--分布式爬虫
分布式爬虫 - 概念:我们需要搭建一个分布式的机群,让其对一组资源进行分布联合爬取. - 作用:提升爬取数据的效率 - 如何实现分布式? - 安装一个scrapy-redis的组件 爬取到的数据自动存 ...