汉字在unicode的编码情况-From http://yedict.com/zsts.htm
| 字符集内容 | 字数 | unicode编码 | 字符显示说明(除非安装更大字库) |
| 基本区 分页: 一 二 三 四 | 共20902字 | 4E00-9FA5 | 电脑和手机都能显示 |
| 基本区补充 | 共90字 | 9FA6-9FFF | 电脑或安卓5以上的手机能显示一部分 |
| 扩展A | 共6582字 | 3400-4DB5 | 电脑和手机都能显示 |
| 扩展A补充 | 共10字 | 4DB6-4DBF | 一般不能显示 |
| 扩展B 分页: 一 二 三 四 五 六 七 八 九 | 共42711字 | 20000-2A6D6 | 从winVista开始,电脑能完整支持。手机能显示一部分 |
| 扩展B补充 | 共9字 | 2A6D7-2A6DF | 一般不能显示 |
| 扩展C | 共4149字 | 2A700-2B734 | 从win8开始,电脑能完整支持,安卓5以上的手机能显示一部分 |
| 扩展C补充 | 共5字 | 2B735-2B739 | 一般不能显示 |
| 扩展D | 共222字 | 2B740-2B81D | 从win8开始,电脑能完整支持,安卓5以上的手机能显示一部分 |
| 扩展E | 共5762字 | 2B820-2CEA1 | win10最新版本能显示一部分,安卓5以上的手机能显示一部分 |
| 扩展F | 共7473字 | 2CEB0-2EBE0 | 一般不能显示,需要配套字体 |
| 扩展G => WS2015 | 共4939字 | 30000-3134A | 一般不能显示,需要配套字体 |
| 扩展H => WS2017 | 共4192字 | 31350-323AF | 一般不能显示,需要配套字体 |
| 扩展I | 共622字 | 2EBF0-2EE5D | 一般不能显示,需要配套字体 |
| 扩展J(拟定中) => WS2021 | 共4952字 | 暂无unicode | 仅有图片字 |
| 康熙部首 | 共214字 | 2F00-2FD5 | 电脑能显示,安卓5以上的手机能显示 |
| 部首扩展 | 共115字 | 2E80-2EF3 | 电脑和手机仅能显示一部分 |
| 兼容汉字 | 共472字 | F900-FAD9 | 电脑和手机仅能显示一部分 |
| 兼容扩展 | 共542字 | 2F800-2FA1D | 电脑能显示一部分,安卓5以上的手机能显示 |
| 汉字笔画 | 共36字 | 31C0-31E3 | 电脑能显示一部分,安卓5以上的手机能显示 |
| 汉字结构 | 共17字 | 2FF0-2FFF,31EF | 电脑和手机都能显示 |
| 汉语注音 | 共43字 | 3105-312F | 电脑手机都能显示大部分 |
| 注音扩展 | 共32字 | 31A0-31BF | 电脑能显示,安卓5以上的手机能显示 |
汉字在unicode的编码情况-From http://yedict.com/zsts.htm的更多相关文章
- .Net(c#)汉字和Unicode编码互相转换
{"Tilte": "\u535a\u5ba2\u56ed", "Href": "http://www.cnblogs.com&q ...
- 将汉字转化为拼音,正则表达式和得到汉字的Unicode编码
一:上图,不清楚的看代码注解,很详细了 二:具体代码 窗体代码 using System; using System.Collections.Generic; using System.Compone ...
- PHP中对汉字进行UNICODE编码和解码的实现
<?php /** PHP中对汉字进行UNICODE编码和解码的实现 **/ class Helper_Tool{ //php中的unicode编码转中文 static function uni ...
- 汉字与区位码互转(天天使用Delphi的String存储的是内码,Windows记事本存储的文件也是内码),几个常见汉字的各种编码,utf8与unicode的编码在线查询,附有读书笔记 good
汉=BABA(内码)=-A0A0=2626(区位码)字=D7D6(内码)=-A0A0=5554(区位码) 各种编码查询表:http://bm.kdd.cc/ 汉(记住它,以后碰到内存里的数值,就会有敏 ...
- 汉的Unicode编码是6C49,而且通常都是小端存储。汉字的unicode范围是:0x4E00~0x9FA5,即CJK一共20928个字符。GBK有21886个汉字,所以多了958个汉字
小端存储的结果是 49 6C UTF-8有点类似于Haffman编码,它将Unicode编码为:0x00-0x7F的字符,用单个字节来表示:0x80-0x7FF的字符用两个字节表示:0x800-0xF ...
- C#怎么判断字符是不是汉字 汉字和Unicode编码互相转换
判断一个字符是不是汉字通常有三种方法,第1种用 ASCII 码判断(在 ASCII码表中,英文的范围是0-127,而汉字则是大于127,根据这个范围可以判断),第2种用汉字的 UNICODE 编码范围 ...
- C#汉字转为Unicode编码
主要用于生成json格式时,将汉字转成Unicoude编码,防止页面乱码. protected string GetUnicode(string text) { string result = &qu ...
- .Net(c#)汉字和Unicode编码互相转换实例
{"name": "\u676d\u5dde", "href": "www.baidu.com"} 经常遇到这样内容的j ...
- char和QChar(Unicode的编码与内存里的值还不是一回事)
char类型是c/c++中内置的类型,描述了1个字节的内存信息的解析.比如: char gemfield=’g’; 那么在由gemfield标记的这块内存的大小就是1个字节,信息就是01100111, ...
- Ansi,UTF8,Unicode,ASCII编码的差别
近日须要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了,以下全是从网上搜来的: 1. ASCII和Ansi编码 字符内码(charcter code)指的是用来代表字符的内 ...
随机推荐
- SQL注入上传文件获取shell
SQL注入写文件的三个必要条件 Web目录有读写权限: 当目标网站的Web目录具有读写权限时,攻击者可以通过注入恶意SQL语句将恶意文件写入服务器上的Web目录. 知道文件的绝对路径: 攻击者需要知道 ...
- ubuntu 之 go+/goplus 安装
目前情况是要安装 goplus/go+ 之前 必须先安装 golang golang下载地址:https://golang.google.cn/dl/ 或者 https://studygolang.c ...
- 用 Socket.D 替代原生 WebSocket 做前端开发
socket.d.js 是基于 websocket 包装的 socket.d 协议的实现.就是用 ws 传输数据,但功能更强大. 功能 原生 websocket socket.d 说明 listen ...
- throws和try、catch有什么区别?throws如何使用?
在Java中,异常处理是非常重要的一部分.当程序出现异常时,我们需要对其进行处理以确保程序的正确性和可靠性.Java提供了两种异常处理机制:throws和try.catch. 区别 throws和tr ...
- 2021-01-20:mysql中,一张表里有3亿数据,未分表,要求是在这个大表里添加一列数据。数据库不能停,并且还有增删改操作。请问如何操作?
2021-01-20:mysql中,一张表里有3亿数据,未分表,要求是在这个大表里添加一列数据.数据库不能停,并且还有增删改操作.请问如何操作? 福哥答案2020-01-20: 陌陌答案: 用pt_o ...
- 《语义增强可编程知识图谱SPG》白皮书
语义増强可编程图谱框架:新一代知识图谱语义框架/引擎.SPG+LLM双驱架构及应用相关进展和应用.<语义增强可编程知识图谱SPG>白皮书 v1.0.pdf: https://url39.c ...
- 你的JoinHint为什么不生效
本文分享自华为云社区<你的JoinHint为什么不生效[绽放吧!GaussDB(DWS)云原生数仓]>,作者:你是猴子请来的救兵吗 . 引言 提起数据库的Hint,几乎每个DBA都知道这一 ...
- GaussDB(DWS)性能调优:indexscan导致的性能问题识别与优化
摘要:通常跑批加工场景下,都是大数量做关联操作,通常不建议使用索引.有些时候因为计划误判导致使用索引的可能会导致严重的性能问题.本文从一个典型的索引导致性能的场景重发,剖析此类问题的特征,定位方法和解 ...
- Apache Pulsar 在火山引擎 EMR 的集成与场景
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 近年来,基于云原生架构的新一代消息队列和流处理引擎 Apache Pulsar 在大数据领域发挥着愈发重要的作用, ...
- C# RSA 非对称加密
代码: RSAHelper.cs(RSA加密工具类): using System; using System.Security.Cryptography; using System.Text; nam ...