char和QChar(Unicode的编码与内存里的值还不是一回事)

char类型是c/c++中内置的类型，描述了1个字节的内存信息的解析。比如：

char gemfield=’g’;
那么在由gemfield标记的这块内存的大小就是1个字节，信息就是01100111，8位。

再比如：

char gemfield=’汉’;
那么由gemfield标记的这块内存的大小依然是1个字节，存储的信息是：0xBA，这是因为在windows系统中，汉字是以gbk编码(ANSI)存储的，“汉”这个字的编码是0xBABA，因为char只有1个字节，所以就把低字节存储过来。

经过gemfield上面的介绍后，你已经理解了char这个内置类型的用法，也就理解了下面语句的输出了：

char gemfield=0×40;
printf(“gemfield’s value is %c”,gemfield);
QChar是Qt处理字符的基本类型,是对unicode字符的封装。QChar使用2个字节的内存，在其内部维护了一个unsigned short 类型的内存（大多数的编译工具也会把它当作unsigned short类型）。使用的是ucs-2标准。

首先，QChar封装一个char类型是相当容易理解的，char类型作为QChar的构造参数时，会被转换为unsigned short，继而可被QChar接管。

其次，QChar封装一个unsigned short类型也是容易理解的，比如：

QChar gemfield=0x6C49;
0x6C49是“汉”字的unicode编码，这样，依据Qt内部使用的unicode表和codec插件，gemfield就可以被成功解析为“汉”这个字。

最后，下面这种情况是QChar不能处理的：

QChar gemfield = ‘汉’;
因为在windows上，“汉”的编码是gbk编码，值为0xBABA，正如gemfield上文提到的那样。这样，由QChar维护的unsigned short内存上的信息是0xBABA，这个值并不是unicode编码（unicode编码值是gemfield上文中提到的0x6C49），所以解析不了。

同理，QChar可以通过unicode()函数返回一个字符的unicode编码。

QChar提供了丰富的函数，来实现一些字符的转换操作和字符的判断操作，关于这些方面的疑问，请参考Qt的文档，或者去http://civilnet.cn/qt上提问。

参考：

https://www.yuque.com/docs/share/41a549e9-258d-405e-b2ed-4d32e3ee5e57
---------------------
作者：冷月醉雪
来源：CSDN
原文：https://blog.csdn.net/lengyuezuixue/article/details/80712909
版权声明：本文为博主原创文章，转载请附上博文链接！

char和QChar(Unicode的编码与内存里的值还不是一回事)的更多相关文章

char和QChar（Unicode的编码与内存里的值还不是一回事）
char类型是c/c++中内置的类型,描述了1个字节的内存信息的解析.比如: char gemfield=’g’; 那么在由gemfield标记的这块内存的大小就是1个字节,信息就是01100111, ...
char类型与Unicode的编码
Java的char型是非常独特的,占用两个字节,因为Java中char型采用了Unicode编码. 要理解这个问题,我们必须要理解什么是Unicode. 世界上存在着多种编码方式,同一个二进制数字可以 ...
数据库char varchar nchar nvarchar，编码Unicode，UTF8，GBK等，Sql语句中文前为什么加N（一次线上数据存储乱码排查）
背景公司有一个数据处理线,上面的数据经过不同环境处理,然后上线到正式库.其中一个环节需要将数据进行处理然后导入到另外一个库(Sql Server).这个处理的程序是老大用python写的,处理完后进 ...
从char到QChar
char类型是c/c++中内置的类型,描述了1个字节的内存信息的解析.比如: char gemfield=’g’; 那么在由gemfield标记的这块内存的大小就是1个字节,信息就是01100111, ...
Java中Unicode的编码和实现
Unicode的编码和实现大概来说,Unicode编码系统可分为编码方式和实现方式两个层次. 编码方式字符是抽象的最小文本单位.它没有固定的形状(可能是一个字形),而且没有值.“A”是一个字符,“ ...
Ansi,UTF8,Unicode,ASCII编码的差别
近日须要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了,以下全是从网上搜来的: 1. ASCII和Ansi编码字符内码(charcter code)指的是用来代表字符的内 ...
Python中GBK, UTF-8和Unicode的编码问题
编码问题,一直是使用python2时的一块心病.几乎所有的控制台输入输出.IO操作和HTTP操作都会涉及如下的编码问题: UnicodeDecodeError:‘ascii’codec can’t d ...
Ansi,UTF8,Unicode,ASCII编码的区别 ---我看完了明白了很多
来自:http://blog.csdn.net/xiongxiao/article/details/3741731 ------------------------------------------ ...
汉字与区位码互转(天天使用Delphi的String存储的是内码，Windows记事本存储的文件也是内码)，几个常见汉字的各种编码，utf8与unicode的编码在线查询，附有读书笔记 good
汉=BABA(内码)=-A0A0=2626(区位码)字=D7D6(内码)=-A0A0=5554(区位码) 各种编码查询表:http://bm.kdd.cc/ 汉(记住它,以后碰到内存里的数值,就会有敏 ...

随机推荐

斜率优化dp 的简单入门
不想写什么详细的讲解了...而且也觉得自己很难写过某大佬(大米饼),于是建议把他的 blog 先看一遍,然后自己加了几道题目以及解析...顺便建议看看算法竞赛(蓝皮书)的 0x5A 斜率优化(P294 ...
关于简单的安卓APP状态栏设置（类似沉浸式状态栏）
1.设置为全屏模式: 在所需设置为全屏模式的逻辑的onCreat()方法中加入以下代码即可: if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.K ...
pycharm导入自己写的模块时，模块下方出现红色波浪线的解决方案
文章链接:https://blog.csdn.net/weixin_38383877/article/details/81121851 这种情况其实可以不用管,是可以正常运行的: 但是,如果看着不舒服 ...
C# 最牛逼的Utility工具类
完整代码: using System; using System.Collections.Specialized; using System.IO; using System.Net; using S ...
Caffe+Matlab'hole
有时候,多坚持一小下下就成功了,遇到问题就频繁重装系统并不可取!放弃很容易,但坚持真的很酷! 1.安装依赖库也能出问题命令行输入: sudo apt-get install libprotobuf- ...
【python】随机数用法
全文拷贝自:Python随机数用法 random.seed(int) 给随机数对象一个种子值,用于产生随机序列. 对于同一个种子值的输入,之后产生的随机数序列也一样. 通常是把时间秒数等变化值作为种子 ...
Autofac 依赖注入框架使用
简介 Autofac是一款IOC框架,比较于其他的IOC框架,如Spring.NET,Unity,Castle等等所包含的,它很轻量级性能上非常高. 官方网站http://autofac.org/ 源 ...
Storm介绍及安装部署
本节内容: Apache Storm是什么 Apache Storm核心概念 Storm原理架构 Storm集群安装部署启动storm ui.Nimbus和Supervisor 一.Apache S ...
asp+SqlServer2008开发【第三集：win2winSSH远程连接—像连接Linux一样操作】
1,参考:https://blog.csdn.net/flyingshuai/article/details/72897692 和https://blog.csdn.net/nijiayy/artic ...
[LeetCode] Number of Lines To Write String 写字符串需要的行数
We are to write the letters of a given string S, from left to right into lines. Each line has maximu ...

char和QChar(Unicode的编码与内存里的值还不是一回事)

char和QChar(Unicode的编码与内存里的值还不是一回事)的更多相关文章

随机推荐

热门专题