GB2312与汉字对应位置

2024-09-01

汉字编码对照表(gb2312/Big5/GB2312)

一.汉字编码的种类 1.GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.它是一个简化字的编码规范,当然也包括其他的符号.字母.日文假名等,共7445个图形字符,其中汉字占6763个.我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字. GB2312规定"对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示",习惯上称第一个字节为"高字节",第二个字节为"低字节&

对GBK的理解（内附全部字符编码列表）：扩充的2万汉字低字节的高位不等于1，而且还剩许多编码空间没有利用

各种编码查询表:http://bm.kdd.cc/ 由于GB 2312-80只收录6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”),部分人名用字(如中国前总理朱镕基的“镕”字),台湾及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内.于是厂商微软利用GB 2312-80未使用的编码空间,收录GB 13000.1-93全部字符制定了GBK编码. 其使用范围如下(注意是汉字编码表,不包括符号编码): 表1 汉字编码范围名称第一字节第二字节 GB231

JS之汉字与Unicode码的相互转化

有时候,我们在给后端传递变量的的值中有汉字,可能由于编码的原因,传递到后端后变为乱码了.所以有时候为了省事或者其它特殊要求的时候,会把传递的汉字转换成Unicode编码后再进行传递. 当然汉字转换成unicode编码,使用JS的charCodeAt()方法就可以. '好'.charCodeAt(0).toString(16) "597d" 这段代码的意思是,把字符'好'转化成Unicode编码,toString()就是把字符转化成16进制了用法:charCodeAt() 方法可返回指

汉字hash问题(转)

一.汉字编码的种类汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5. 1.GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.它是一个简化字的编码规范,当然也包括其他的符号.字母.日文假名等,共7445个图形字符,其中汉字占6763个.我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字. GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高

【STM32H7教程】第53章 STM32H7的LTDC应用之汉字小字库和全字库制作

完整教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=86980 第53章 STM32H7的LTDC应用之汉字小字库和全字库制作本章教程为大家讲解汉字小字库和全字库的制作方式,实际项目中用到的地方比较多. 53.1 初学者重要提示 53.2 使用MakeDot小软件生成C文件格式小字库方法 53.3 使用MakeDot小软件生成C文件格式全字库方法 53.4 C文件格式汉字使用方法 53.5 汉字显示方法解析 53.6

中文编码之GB2312，Big5，GBK简介

汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5. 1.GB2312 又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.它是一个简化字的编码规范,共7445个图形字符,其中一级汉字3755个,二级汉字3008个:同时,GB 2312收录了包括拉丁字母.希腊字母.日文平假名及片假名字母.俄语西里尔字母在内的682个全角字符.我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字. 整个字符集分成94个区,每区有94

字符编码：ANSI，ASCII，GB2312，GBK，Big5，Unicode和UTF-8

整理自字符编码笔记:ASCII,Unicode和UTF-8 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定.这被称为ASCII

php 汉字排序

<?phpheader("content-type:text/html;charset=utf-8");$array=array('重庆市','上海市','安徽省','吉林省','天津市','内蒙古自治区','沈阳市','浙江省','广东省','云南省');foreach($array as $value){ $arr[]=iconv('UTF-8', 'GBK', $value);}$res=asort($arr);var_dump($arr);#array(10) { [0]

转载：从程序员的角度看ASCII, GB2312, UNICODE, UTF-8

以下内容转自博客:http://blog.chinaunix.net/uid-22670933-id-1771613.html. 一.字符编码是怎么回事 0. 概念字节是计算机的最基本存储单位,一个字节包括8个位. 字符是一种文字的基本单位,比如'A' 是一个字符,'汉' 也是一个字符. 1. 计算机被发明之后,程序员们编写了很多复杂的计算让计算机运行. 但是一个问题是,计算机如何把辛苦计算的结果告知程序员? 假设计算机把计算结果放在某个寄存器,内容是 1010010 总不能让程序员去检测每个

C# 真正完美的汉字转拼音

网上有很多说自己整理的汉字转拼音是完美的,但使用后才发现都是半吊的瓶子,问题多多. 常见的生僻字,或多音字识别,转换后简直让人感觉可怕. 主流的转换有三种:hash匹配,Npinyin,微软PinYinConverter. 但单用这三个,都没法做到完美,为什么没人考虑融合呢? 我的方案:Npinyin+微软PinYinConverter(首选Npinyin) 微软PinYinConverter 为什么:微软PinYinConverter很强大,但在多音字面前,犯了传统的错误,按拼音字母排序.如[

java获取多个汉字的拼音首字母

本文属于http://java.chinaitlab.com/base/803353.html原创!!! public class PinYin2Abbreviation { // 简体中文的编码范围从B0A1(45217)一直到F7FE(63486) ; ; // 按照声母表示,这个表是在GB2312中的出现的第一个汉字,也就是说“啊”是代表首字母a的第一个汉字. // i, u, v都不做声母, 自定规则跟随前面的字母 private static char[] chartable = {

SQL Server 特殊字符及中文汉字的处理

简介在SQL Server 中很多时候需要对一些字段中特殊的字符做处理,比如某个字段中包含一些回车.制表.换行等特殊字符(这些字符往往来源于Excel).这些特殊字符的存在可能导致无法提取到所需数据,下面来简单介绍一下对这些特殊字符的处理. 一.特殊字符处理 char(10) 换行符( \r ) char(13) 回车 ( \n ) char(9) 水平制表符( \t ) 对于这三个最常见的隐式字符在SQL Server中只需使用 REPLACE 函数来做替换.如下: S

python基础-基本数据类型

一. 运算符 1.算数运算: ps: 示例1: python2.7示例 #!/usr/bin/env python # -*- coding:utf-8 -*- #Author: nulige #算数运算符 from __future__ import division #python2.x必须引入division模块.python3.x不需要. val = 9 / 2 print(val) 执行结果: 4.5 python3.x示例 #!/usr/bin/env python # -*- co

HTML认识

1.1 认识什么是纯文本文件 txt window自带有一个软件,叫做记事本,记事本保存的格式TXT,就是英文text的缩写,术语上称呼为"纯文本文件" TXT文件,只能保存文本内容,是无法记录文本的样式的所以 ,doc和txt存储相同的文本内容,doc比txt大: 总结: 纯文本就是这样的文件 : 只有文本,没有样式 : 用记事本等纯文本编译器可读,不是乱码 (HTML,CSS ,JS都是纯文本的) 1.2 HTML负责描述文档语义的语言 HTML的英文hyperText

一． HTML认识

1.1认识什么是纯文本文件txt window自带有一个软件,叫做记事本,记事本保存的格式就是TXT,就是英文text的缩写,术语上称呼为"纯文本文件. TXT文件,只能保存文本内容,是无法记录文本的样式的所以,doc和txt存储相同的文本内容,doc比txt大. 纯文本就是这样的文件  只有文本,没有样式  用记事本等纯文本编译器可读,不是乱码 HTML.CSS.js都是纯文本的 1.2 HTML是负责描述文档语义的语言 HTML的英文 hyperText Markup Language

HTML 认识

1.1认识什么是纯文本文件 Window 自带的一个软件,叫做记事本,记事本保存的格式就是TXT,就是英文text的缩写,术语上称呼为"纯文本文件". 注意: TXT文件,只能保存文本内容,是无法记录文本样式发.所以,doc和txt存储相同发文本内容,doc比txt大. 总结: 纯文本就是这样的文件: 只有文本,没有样式用记事本等纯文本编译器可读,不是乱码 HTML.CSS.js都是纯文本的 1.2HTML是负责描述文档语义的语言 HTML的英文:hyperText Marku

几个字符串的误区，以及setlocale函数的使用

转自 http://www.blogjava.net/baicker/archive/2007/08/09/135642.html 转自 http://witmax.cn/character-encoding-notes.html 写了n年程序,近来在字符串上栽了.:( 认真的研究了一些关于字符串的文章,在此记下.许多关于字符串的问题,在文章最后的参考文章中,相信有更加深入和精确的描述.不过关于中文的处理,我想先补充一些自己的看法. 背景:WIN32 console程序,使用printf输出字符

html.day01

1.web标准: 1. 结构 (xhtml) 2. 表现(css) 3.行为(js) html 超文本标记语言 xhtml (严格型超文本标记语言) 2.规范: 1. 所有标签(标记)都要放到< > 之内例如:<b> 2. 所有的标记必须闭合.(不一定成对) 其中 / (关闭符号) 例如:<b> </b> <div> </div> <br /> 3.必须使用<!DOCTYPE

位（bit）、字节（byte）、字符、编码之间的关系

1.位: 数据存储的最小单位.每个二进制数字0或者1就是1个位: 2.字节: 8个位构成一个字节:即:1 byte (字节)= 8 bit(位): 1 KB = 1024 B(字节): 1 MB = 1024 KB; (2^10 B) 1 GB = 1024 MB; (2^20 B) 1 TB = 1024 GB; (2^30 B) 3.字符: a.A.中.+.*.の......均表示一个字符: 一般 utf-8 编码下,一个汉字字符占用 3 个字节: 一般 gbk 编码下,一个

python初学心得之一

昨天开始接触并学习python,对python有了初步印象. 一.python主要应用方向二.python语言类型三.python2和3的主要区别四.常见字符编码五.Python语法初学一.python主要应用方向 1.WEB开发 Python拥有很多免费数据函数库.免费web网页模板系统.以及与web服务器进行交互的库,可以实现web开发,搭建web框架,目前比较有名气的Python web框架为Django.从事该领域应从数据.组件.安全等多领域进行学习,从底层了解其工作原理并可

GB2312与汉字对应位置

热门专题