GBK、UTF8、UNICODE编码转换

 string GBKToUTF8(const std::string& strGBK)

 {

     int nLen = MultiByteToWideChar(CP_ACP, , strGBK.c_str(), -, NULL, );

     WCHAR * wszUTF8 = new WCHAR[nLen];

     MultiByteToWideChar(CP_ACP, , strGBK.c_str(), -, wszUTF8, nLen);

     nLen = WideCharToMultiByte(CP_UTF8, , wszUTF8, -, NULL, , NULL, NULL);

     char * szUTF8 = new char[nLen];

     WideCharToMultiByte(CP_UTF8, , wszUTF8, -, szUTF8, nLen, NULL, NULL);

     std::string strTemp(szUTF8);

     delete[]wszUTF8;

     delete[]szUTF8;

     return strTemp;

 }

 string UTF8ToGBK(const std::string& strUTF8)

 {

     int nLen = MultiByteToWideChar(CP_UTF8, , strUTF8.c_str(), -, NULL, );

     unsigned short * wszGBK = new unsigned short[nLen + ];

     memset(wszGBK, , nLen *  + );

     MultiByteToWideChar(CP_UTF8, , strUTF8.c_str(), -, (LPWSTR)wszGBK, nLen);

     nLen = WideCharToMultiByte(CP_ACP, , (LPWSTR)wszGBK, -, NULL, , NULL, NULL);

     char *szGBK = new char[nLen + ];

     memset(szGBK, , nLen + );

     WideCharToMultiByte(CP_ACP,, (LPWSTR)wszGBK, -, szGBK, nLen, NULL, NULL);

     std::string strTemp(szGBK);

     delete[]szGBK;

     delete[]wszGBK;

     return strTemp;

 }

 std::string Gbk2Unicode(std::string &strValue)

 {

     std::string strReturn;

     unsigned char chTemp;

     int nLength = strValue.length()*+;

     WCHAR *pwchBuf = new WCHAR[nLength];

     memset(pwchBuf, , sizeof(WCHAR) * nLength);

     MultiByteToWideChar(CP_ACP, , strValue.c_str(), -, (LPWSTR)pwchBuf, nLength);

     for (size_t i = ; i < wcslen(pwchBuf); i++)

     {

         strReturn += "\\u";

         chTemp = *((unsigned char*)pwchBuf+i*+);

         if(chTemp)

         {

             strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp >> ) );

             strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp % ) );

         }

         chTemp = *((unsigned char*)pwchBuf+i*);

         strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp >> ) );

         strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp % ) );

     }

     delete[]pwchBuf;

     pwchBuf = NULL;

     return strReturn;

 }

 std::string Unicode2GBK(std::string &strValue)

 {

     std::vector<std::string> vcString;

     MyTools::SplitString(strValue, "\\u", vcString);

     wchar_t* pwBuf = new wchar_t[strValue.length() + ];

     memset(pwBuf, , (strValue.length() + )* sizeof(wchar_t));

     int j();

     for(std::vector<std::string>::iterator it = vcString.begin(); it != vcString.end(); ++it)

     {

         if (it->empty())

         {

             continue;

         }

         unsigned short wcTmp = ;

         unsigned char cTmp = ;

         //因为有中文字符混合ASSCII码情况,所以条件为k < it->length()

         for(size_t k = ; k < it->length(); ++k)

         {

             cTmp = (unsigned char)(*it)[k];

             if(cTmp <= '')//0x30~0x39 即0~9

             {

                 wcTmp |= (cTmp & 0x0f) << (it->length() - k - ) * ;

             }

             else if(cTmp >= 'a')//0x61~7a 即a~z

             {

                 wcTmp |= (cTmp - 0x57) << (it->length() - k - ) * ;

             }

             else//0x41~5a 即A~Z

             {

                 wcTmp |= (cTmp - 0x37) << (it->length() - k - ) * ;

             }

         }

         pwBuf[j++] = (wchar_t)wcTmp;

     }

     char *pDst = new char[strValue.length() + ];

     memset(pDst, , (strValue.length() + ) * sizeof(char));

     WideCharToMultiByte(CP_ACP, , pwBuf, -, (char*)pDst, strValue.length() - , NULL, NULL);

     std::string strRet(pDst);

     delete[]pwBuf;

     pwBuf= NULL;

     delete[]pDst;

     pDst=NULL;

     return strRet;

 }

GBK、UTF8、UNICODE编码转换的更多相关文章

多字节(一般指GBK) utf8 Unicode 编码互转
// c:\Program Files\Microsoft SDKs\Windows\v7.0A\Include\WinNls.h #define CP_ACP 0 // default to ANS ...
转换编码，将Unicode编码转换成可以浏览的utf-8编码
//转换编码,将Unicode编码转换成可以浏览的utf-8编码 public function unicodeDecode($name) { $pattern = '/([\w]+)|(\\\u([ ...
Qt中文编码和QString类Unicode编码转换
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/g423tgl234/article ...
C#中文和UNICODE编码转换
C#中文和UNICODE编码转换 //中文轉為UNICODE string str = "中文"; string outStr = ""; if (!strin ...
MySQL 解决 emoji表情的方法，使用utf8mb4 字符集(4字节 UTF-8 Unicode 编码)
p.p1 {margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px 'Helvetica Neue'; color: #454545} span.s1 {font: ...
Unicode编码转换， MD5加密，URL16进制加密解密
一.站长网址:http://www.msxindl.com/ 1.Unicode与中文互转 16进制Unicode编码转换.还原 :http://www.msxindl.com/tools/uni ...
GBK/ UTF-8/ UNICODE（字符编码）
在python2中:如果执行程序,在编译器中,因为默认的编码是ASCII码(英文),所以如果输入中文就会出现乱码,因此为了避免这种乱码的情况发生,在输入中文字符串之后,必须进行手动转码,将GBK/ U ...
gbk转utf-8 iconv 编码转换
linux以下有时候字符须要进行编码转换(爬虫将gbk转为utf-8编码...).一般能够选择iconv函数. 终端以下输入 man 3 iconv 得到 iconv函数的用法. 个人看习惯了 ...
Java用native2ascii命令做unicode编码转换
背景:在做Java开发的时候,常常会出现一些乱码,或者无法正确识别或读取的文件,比如常见的validator验证用的消息资源(properties)文件就需要进行Unicode重新编码.原因是java ...
GBK与Unicode的转换
一.GBK转换到Unicode编码 std::string Gbk2Unicode(std::string &strValue) { std::string strReturn; unsign ...

随机推荐

sqlite query用法
本文转自http://blog.csdn.net/double2hao/article/details/50281273,在此感谢作者 query(table, columns, selection, ...
c++中级 STL基础学习（二）
deque 和vector差不多,可以在前端后端插入,一般用deque取代vector,vector只能在后端插入push_back().deque还可以push_front(),但是deque后端插 ...
linux 系统下开机自动启动oracle 监听和实例（亲测有效）
[oracle@oracle11g ~]$ dbstartORACLE_HOME_LISTNER is not SET, unable to auto-start Oracle Net Listene ...
EditText 焦点
让EditText不自动获取焦点,只需要在EditText的父控件加上 android:focusable="true"android:focusableInTouchMode=& ...
Java 第14章字符串
字符串基本数据类型和引用数据类型作为方法参数 ,在传递时有什么不同之处. 答:基本数据类型按值传递,相当于复制了一份过去. 引用数据类型是指向引用内存地址,两个地方根据地址使用同一份数据,如被更 ...
Java入门1day
Java安装及环境变量配置 1.安装 2.环境变量配置 1) 右击"计算机"-->属性(R)-->高级系统设置-->高级-->环境变量 2) 系统变量(或用 ...
git的一些指令
1.这是一篇git.github相关具体操作的连接 http://www.cnblogs.com/fanyong/p/3424501.html 2. git remote -v 查看远程分支 git ...
eclipse中无法使用fat.jar
因为某种需要,我要打jar包,而eclipse中自带的打包功能又太过于繁琐,因此找到这个插件.不过尝试了许久都没有成功,最后终于找到了原因,是因为该插件的版本太低的缘故.相见:https://code ...
Maven 跳过测试命令行参数 skip test
mvn package -Dmaven.test.skip=true
C语言itoa()函数和atoi()函数详解(整数转字符C实现)
1.int/float to string/array: C语言提供了几个标准库函数,可以将任意类型(整型.长整型.浮点型等)的数字转换为字符串,下面列举了各函数的方法及其说明. ● itoa():将 ...

GBK、UTF8、UNICODE编码转换

GBK、UTF8、UNICODE编码转换的更多相关文章

随机推荐

热门专题