字符集(编码)转换_Qt532

1、网上的资料：

　　1.1、参考网址：http://blog.csdn.net/changsheng230/article/details/6588447

　　1.2、网页内容：

“

Qt 使用Unicode编码来存储操作字符串，但很多情况下，我们不得不处理采用其他编码格式的数据，举例来说，中文多采用GBK和Big5编码，而日本则多采用Shift-JIS or ISO2022编码。本文将讨论如何将其他编码格式的字符串转化成采用Unicode编码的QString

// Method 1

    QString str = QString::fro mLocal8Bit("本地文本");

    QString str2 = QString("本地文本");  // 乱码

// Method 2

    QTextCodec *codec = QTextCodec::codecForName("GBK"); // get the codec for KOI8-R

    QString locallyEncoded = codec->toUnicode( "显示中文" );

    qDebug() << locallyEncoded << endl;

//更多细节请参见：

http://www.kuqin.com/qtdocument/qtextcodec.html

http://blog.csdn.net/catamout/article/details/5675878

”

2、我的理解

　　QString在底层是使用Unicode来存储字符串的(Java的String也是这样)，Unicode 也是一种编码的方式且它是用2个字节来存储一个字符的(宽字符)，不管是英文的一个单词/中文的一个汉字/等它都是使用 2个字节来存储。

　　Unicode作为一种中间状态存储在QString中，不同编码方式(如 GBK/utf-8/等)的字符串先通过它们的编码方式转码成Unicode(也就是QString)，然后我们需要什么编码方式再从Unicode转为目标的编码方式的字节数组。

　　ZC: 使用中，与Java不同之处：(需要注意)
　　　　我的理解是这样的：

3、我的测试代码：(该cpp文件编码方式为"UTF-8 + BOM")

// http://blog.csdn.net/changsheng230/article/details/6588447

    wchar_t *pwc = L"我是中国人";　　// ZC: 这里是使用的 编码方式为"UTF-8 + BOM"

    qDebug() << "(1) ==>";

    for (size_t i=; i<wcslen(pwc); i++)

    {

        ushort us = pwc[i];

        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');

    }


　　// ZC: QString 默认还是使用GBK

    QTextCodec *codec = QTextCodec::codecForName("GBK"); // get the codec for KOI8-R

    QString locallyEncoded = codec->toUnicode( "我是中国人" );

    qDebug() << locallyEncoded << endl;

    QChar *pcs = (QChar*)locallyEncoded.unicode();

    qDebug() << "(2) ==>";

    for (int i=; i<locallyEncoded.length(); i++)

    {

        QChar c = pcs[i];

        ushort us = c.unicode();

        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');

    }

    pcs = (QChar*)locallyEncoded.data();

    qDebug() << "(3) ==>";

    for (int i=; i<locallyEncoded.length(); i++)

    {

        QChar c = pcs[i];

        ushort us = c.unicode();

        qDebug() << "\t" << QString::number(us, ).leftJustified(, '');

    }

    QTextCodec *codecUtf8 = QTextCodec::codecForName("utf-8");

    QByteArray ba = codecUtf8->fromUnicode(locallyEncoded);

    qDebug() << "(4) ==>";

    for (int i=; i<ba.length(); i++)

    {

        ushort us = ba[i];

        us &= 0xFF;

        qDebug() << "\t("<< QString::number(i).rightJustified(, '') <<")"

                 << QString::number(us, ).leftJustified(, '');

    }

    ba = locallyEncoded.toUtf8();

    qDebug() << "(5) ==>";

    for (int i=; i<ba.length(); i++)

    {

        ushort us = ba[i];

        us &= 0xFF;

        qDebug() << "\t("<< QString::number(i).rightJustified(, '') <<")"

                 << QString::number(us, ).leftJustified(, '');

    }

　　3.1、打印的信息：

() ==>

     ""

     "662f"

     "4e2d"

     "56fd"

     "4eba"

"我是中国人" 

() ==>

     ""

     "662f"

     "4e2d"

     "56fd"

     "4eba"

() ==>

     ""

     "662f"

     "4e2d"

     "56fd"

     "4eba"

() ==>

    ( "" ) "e6"

    ( "" ) ""

    ( "" ) ""

    ( "" ) "e6"

    ( "" ) ""

    ( "" ) "af"

    ( "" ) "e4"

    ( "" ) "b8"

    ( "" ) "ad"

    ( "" ) "e5"

    ( "" ) "9b"

    ( "" ) "bd"

    ( "" ) "e4"

    ( "" ) "ba"

    ( "" ) "ba"

() ==>

    ( "" ) "e6"

    ( "" ) ""

    ( "" ) ""

    ( "" ) "e6"

    ( "" ) ""

    ( "" ) "af"

    ( "" ) "e4"

    ( "" ) "b8"

    ( "" ) "ad"

    ( "" ) "e5"

    ( "" ) "9b"

    ( "" ) "bd"

    ( "" ) "e4"

    ( "" ) "ba"

    ( "" ) "ba"

4、

5、

字符集(编码)转换_Qt532_QString的更多相关文章

字符集(编码)转换_Linux
ZC: 来自我的项目 czgj 1.代码: #include <stdio.h> #include <iconv.h> #include <string.h> / ...
字符集(编码)转换_Windows
ZC: 来自我的项目 czgj ZC: (1).经过测试 MultiByteToWideChar(...) 返回的是 (需要的)WideChar[宽字符]的个数:(2).WideCharToMult ...
关于JS的编码转换问题
在进行JS开发过程中,尤其是在开发报表时,报表已集成到Web页面中,通过在页面传递参数至报表中时,会发现有时某些参数值,传递到报表中是显示为问号或乱码等等一系列不能正常显示的情况. 这是由于浏览器和报 ...
帆软报表FineReport数据库连接编码转换
1. 问题描述数据库会以某种编码方式保存与读取数据,FineReport解析时默认使用GBK字符集,若数据库端编码与设计器端编码不一致时,就会导致中文及特殊字符的乱码. FineReport在定义数 ...
java Unicode、ISO-8859-1、GBK、UTF-8编码转换深入浅出
参考文献:搞懂ASCII, ISO8859-1, ANSI和Unicode Unicode百度文献 ISO-8859-1百度文献注: 1.utf-8虽然是国际编码,对不同范围的字符使用不同长度的编码 ...
Base64的编码转换方式
下面,详细介绍Base64的编码转换方式. 所谓Base64,就是说选出64个字符----小写字母a-z.大写字母A-Z.数字0-9.符号"+"."/"(再加上 ...
各种编码中汉字所占字节数；中文字符集编码Unicode ,gb2312 , cp936 ,GBK，GB18030
vim settings set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936,latin1set termencoding=utf-8se ...
理解perl的编码转换——utf8以及乱码
工作需要,闲暇之余,仔细研究了一下脚本乱码的问题 1. vim新建的文件 1)在linux命令行 vim命令建立的文件,如果内容中不出现中文,默认是ASCII.那么用notepad++打开的时候,就是 ...
iconv字符编码转换
转自 http://blog.csdn.net/langresser_king/article/details/7459367 iconv(http://www.gnu.org/software/li ...

随机推荐

CUDA显卡运算编程菜鸟入门指南1——Hello world - yfszzx的专栏 - 博客频道 - CSDN.NET
第一次知道有显卡(GPU)编程这个东西,是去年比特币最热门的时候,看了几篇关于比特币的文章,说比特币挖矿要靠显卡,CPU的速度与GPU根本就没法比,于是就非常好奇,显卡是什么神奇的东西?为什么运算速度 ...
OO第四次阶段性总结
测试与正确性论证的效果差异及优缺点测试实际上就是对程序进行的一种黑箱测试,利用各种各样的测试样例去检验程序是否能够给出正确的结果.其中的单元测试则是将整体的测试拆分成单元来进行,但其仍然躲不开黑箱测 ...
bzoj2733: [HNOI2012]永无乡启发式合并
地址:http://www.lydsy.com/JudgeOnline/problem.php?id=2733 题目: 2733: [HNOI2012]永无乡 Time Limit: 10 Sec ...
EditPlus 4.3.2543 中文版已经发布（2月3日更新，Emmet 功能回归）
新的 EditPlus 版本修复了 Emmet 组件的安全问题. 现在 Emmet 编辑功能又回来啦. 下载连接在页面左上角!
Storm消息可靠处理机制
在很多应用场景中,分布式系统的可靠性保障尤其重要.比如电商平台中,客户的购买请求需要可靠处理,不能因为节点故障等原因丢失请求:比如告警系统中,产生的核心告警必须及时完整的知会监控人员,不能因为网络故障 ...
线程等待——CountDownLatch使用
告警性能优化过程中,遇到如下问题:1. 在数据库计算几十万个实体的KPI值的方差:2. 计算结果进行表格化处理. 这里KPI包含多个Counter的数据库函数运算(比如Decode,AVG等函数),方 ...
【转】Java中Synchronized的用法
<编程思想之多线程与多进程(1)——以操作系统的角度述说线程与进程>一文详细讲述了线程.进程的关系及在操作系统中的表现,这是多线程学习必须了解的基础.本文将接着讲一下Java线程同步中的一 ...
ACM第二站————STL之stack
栈,作为一种最基础的数据结构(栈还是一种内存的存储形式,就不介绍了),在各种数据结构的题目都会间接或者直接用到. 栈是一种受到限制的线性表,其限制是仅允许在表的一端进行插入和删除运算.这也给予了栈的一 ...
06: Django Admin
目录:Django其他篇 01:Django基础篇 02:Django进阶篇 03:Django数据库操作--->Model 04: Form 验证用户数据 & 生成html 05:Mo ...
CF 316E3 Summer Homework(斐波那契矩阵+线段树)
题目链接:http://codeforces.com/problemset/problem/316/E3 题意:一个数列A三种操作:(1)1 x y将x位置的数字修改为y:(2)2 x y求[x,y] ...

字符集(编码)转换_Qt532_QString

字符集(编码)转换_Qt532_QString的更多相关文章

随机推荐

热门专题