字王·国标二级字库汉字GB内码un码三合一对照表2016版
国标二级字库汉字GB内码un码三合一对照表
字王2016版
汉字内码表,是制作字库的基础,简单、便利的版本很少,根据实战经验,特此制作这个三合一版本的汉字、GB内码、Unicode码对照表:
l 提供GB内码、Unicode内码两种不同格式的版本。
l 格式如下:汉字,GB内码、Unicode-16内码;中间用英文逗号符分隔,
l 每行最后的逗号符,并非多于,便于编程、批命令需要,特别是python的list列表导入。
l 国标一二级字库,源自1980年颁布的《信息交换用汉字编码字符集--基本集》,国家标准号为:GB2312-80.
l 国标一级字库3755字,是常用汉字,按拼音排序;二级字库3008字,是非常用汉字,按部首和笔画排序。
l 1975年,根据涵盖数亿、专业汉字频度统计,实际使用汉字数为6335个,其中3000多个汉字累计频度为了99.9%,另外3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。
l 截图、内码查看,使用的是软件:ultraEdit
字王国标三合一内码对照表,共收录了以下四个内码表格文件:
n 文件:gb7652_un内码版.txt,unicode内码版本,字王增强型汉字内码表,共7652个字符,除国标二级汉字外,还收录了全角/半角英文字母、数字,以及日文、制表符、常用标点符号,和部分增补汉字。
n 文件:gb7652_gb内码版.txt,除内码是GB格式外,内容同上。
n 文件:gb6763k_un内码版.txt,纯国标汉字内码表,共6763个汉字,unicode内码版本。
n 文件:gb6763k_gb内码版.txtt,除内码是GB格式外,内容同上。
【GB内码版本】截图
【Unicode内码版本】截图
注意
l unicode文件,开头两个字符内码是:FF FE,这是unicode文件的识别符号,不是正文
l Unicode内码顺序是反的,截图汉字“啊”的内码是:554A ,在截图中显示的是:4A 55
字王·中国
l 技术Blog:http://blog.sina.com.cn/zbrow
l 网盘下载:http://pan.baidu.com/s/1tY7Wq
l QQ群:124134140 (字王云字库&zwPython,字王项目,唯一互动平台)
l 字王Git项目总览:https://github.com/ziwang-com/,
字王·国标二级字库汉字GB内码un码三合一对照表2016版的更多相关文章
- 字王4K云字库入驻github
字王4K云字库入驻github 网址:https://github.com/ziwang-com/zw4kFont 2015.3.28,字王4K云字库入驻github,原本或早或晚,不过这几天在g ...
- zw字王《中华大字库》2018版升级项目正式启动
zw字王<中华大字库>2018版升级项目正式启动 https://www.cnblogs.com/ziwang/p/9500537.html 这次升级是和字库协会一起合作,首批推出的字体, ...
- zwPython,字王集成式python开发平台,比pythonXY更强大、更方便。
zwPython,字王集成式python开发平台,比pythonXY更强大.更方便. 更强大,内置opencv.cuda/opencl.NLTK自然语言.pygame游戏设计等多个重量级模块库. 更方 ...
- 刨根究底字符编码之十六——Windows记事本的诡异怪事:微软为什么跟联通有仇?(没有BOM,所以被误判为UTF8。“联通”两个汉字的GB内码,其第一第二个字节的起始部分分别是“110”和“10”,,第三第四个字节也分别是“110”和“10”)
1. 当用一个软件(比如Windows记事本或Notepad++)打开一个文本文件时,它要做的第一件事是确定这个文本文件究竟是使用哪种编码方式保存的,以便于该软件对其正确解码,否则将显示为乱码. 一般 ...
- 字王谈M1字形与个人云字库
字王谈M1字形与个人云字库 最近在忙网络项目,字库其实也没完全搁下,只是没有时间细大理,这些文字idea,来自近日和大梁先生的QQ聊天,虽然口语化很重,但觉得有些价值,作为blog发了 ----- ...
- 《FontForge常见问题FAQ》字王翻译版
<FontForge常见问题FAQ> 字王翻译版 原文: http://fontforge.github.io/en-US/faq/ 翻译: 字王·中国 blog: http://bl ...
- 字王大藏经体v0.1概念版
字王大藏经体v0.1概念版 zw-dzj 字王大藏经体v0.1概念版,是字王<中华大字库>2018版升级过程当中,在Github搜索资源时的意外惊喜. 大藏经为佛教经典的总集,简称为藏经. ...
- zw-clay字王胶泥体系列
zw-clay字王胶泥体系列 zw-clay字王胶泥体系列,2018新版,也是在2012版本的基础上升级的. 字王胶泥体系列的idea,源自黏土动画电影的制作模式.同样,字王胶泥体系列,也非常适合于动 ...
- linux下内网端口转发工具:linux版lcx [实现远程内网维护]
这个工具以前使用的初衷是内网渗透,需要将内网ssh端口转发到外网服务器上.但这个工具同样适用于运维工程师进行远程内网维护. 当然这一切的前提是内网可以访问外网,检测方法当然就是直接ping 一个外网I ...
随机推荐
- python2.0_day18_Django自带的用户认证模块的使用
用户验证我们基于一个项目来学习利用Django框架中的user表实现用户认证Django练习小项目:学员管理系统设计开发 项目需求: 1.分讲师\学员\课程顾问角色, 2.学员可以属于多个班级,学员成 ...
- UART简介
经常遇到初学者,对单片机串行通讯出了问题不知道如何办的情况.其实最有效的调试方法是用示波器观察收发数据的波形.通过观察波形可以确定以下情况: 1.数据是否接收或发送: 2.数据是否正确: 3.波特率是 ...
- vue报错一
8080端口被占用 解决方案: 打开cmd输入:netstat -ano查看所有端口信息,如图,找到端口 8080,以及对应的 PID: 输入:tskill PID 即可杀死进程,ex:: tskil ...
- JZOJ.5335【NOIP2017模拟8.24】早苗
Description
- net 中的一些知识
这是一篇摘抄的文章 有一些内容对我很有帮助 .有一些内容解释很清晰 所以我拿过来了. 第一遍用了5天时间,第二遍看的时候决定自己复制一份出来于是有了这儿博客. 什么是.NET?什么是.NET Fram ...
- Python 自学积累(二)
1. onfigParser 模块用于操作配置文件 注:Parser汉译为“解析”之意. 配置文件的格式与windows ini文件类似,可以包含一个或多个节(section),每个节可以有多个参数( ...
- 修改Yii2的默认语言language为中文zh-CN的方法
如果用的语言是en-US的话,网页加载速度很慢,因为要加载国外镜像或者链接什么的,使用zh-CN就直接加载国内链接或者CDN,速度比较快: ------------------------------ ...
- Apache的配置详解,最好的Apache配置文档
http://blog.csdn.net/apple_llb/article/details/50253889 Apache的配置由httpd.conf文件配置,因此下面的配置指令都是在httpd.c ...
- 组织机构代码校验码生成算法(C#版)
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
- hdu5542 The Battle of Chibi【树状数组】【离散化】
The Battle of Chibi Time Limit: 6000/4000 MS (Java/Others) Memory Limit: 65535/65535 K (Java/Othe ...