多字节与UTF-8、Unicode之间的转换
from http://blog.csdn.net/frankiewang008/article/details/12832239
- // 多字节编码转为UTF8编码
- bool MBToUTF8(vector<char>& pu8, const char* pmb, int32 mLen)
- {
- // convert an MBCS string to widechar
- int32 nLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);
- WCHAR* lpszW = NULL;
- try
- {
- lpszW = new WCHAR[nLen];
- }
- catch(bad_alloc &memExp)
- {
- return false;
- }
- int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, lpszW, nLen);
- if(nRtn != nLen)
- {
- delete[] lpszW;
- return false;
- }
- // convert an widechar string to utf8
- int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, NULL, 0, NULL, NULL);
- if (utf8Len <= 0)
- {
- return false;
- }
- pu8.resize(utf8Len);
- nRtn = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, &*pu8.begin(), utf8Len, NULL, NULL);
- delete[] lpszW;
- if (nRtn != utf8Len)
- {
- pu8.clear();
- return false;
- }
- return true;
- }
- // UTF8编码转为多字节编码
- bool UTF8ToMB(vector<char>& pmb, const char* pu8, int32 utf8Len)
- {
- // convert an UTF8 string to widechar
- int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);
- WCHAR* lpszW = NULL;
- try
- {
- lpszW = new WCHAR[nLen];
- }
- catch(bad_alloc &memExp)
- {
- return false;
- }
- int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, lpszW, nLen);
- if(nRtn != nLen)
- {
- delete[] lpszW;
- return false;
- }
- // convert an widechar string to Multibyte
- int32 MBLen = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, NULL, 0, NULL, NULL);
- if (MBLen <=0)
- {
- return false;
- }
- pmb.resize(MBLen);
- nRtn = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, &*pmb.begin(), MBLen, NULL, NULL);
- delete[] lpszW;
- if(nRtn != MBLen)
- {
- pmb.clear();
- return false;
- }
- return true;
- }
- // 多字节编码转为Unicode编码
- bool MBToUnicode(vector<wchar_t>& pun, const char* pmb, int32 mLen)
- {
- // convert an MBCS string to widechar
- int32 uLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);
- if (uLen<=0)
- {
- return false;
- }
- pun.resize(uLen);
- int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, &*pun.begin(), uLen);
- if (nRtn != uLen)
- {
- pun.clear();
- return false;
- }
- return true;
- }
- //Unicode编码转为多字节编码
- bool UnicodeToMB(vector<char>& pmb, const wchar_t* pun, int32 uLen)
- {
- // convert an widechar string to Multibyte
- int32 MBLen = WideCharToMultiByte(CP_ACP, 0, pun, uLen, NULL, 0, NULL, NULL);
- if (MBLen <=0)
- {
- return false;
- }
- pmb.resize(MBLen);
- int nRtn = WideCharToMultiByte(CP_ACP, 0, pun, uLen, &*pmb.begin(), MBLen, NULL, NULL);
- if(nRtn != MBLen)
- {
- pmb.clear();
- return false;
- }
- return true;
- }
- // UTF8编码转为Unicode
- bool UTF8ToUnicode(vector<wchar_t>& pun, const char* pu8, int32 utf8Len)
- {
- // convert an UTF8 string to widechar
- int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);
- if (nLen <=0)
- {
- return false;
- }
- pun.resize(nLen);
- int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, &*pun.begin(), nLen);
- if(nRtn != nLen)
- {
- pun.clear();
- return false;
- }
- return true;
- }
- // Unicode编码转为UTF8
- bool UnicodeToUTF8(vector<char>& pu8, const wchar_t* pun, int32 uLen)
- {
- // convert an widechar string to utf8
- int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, NULL, 0, NULL, NULL);
- if (utf8Len<=0)
- {
- return false;
- }
- pu8.resize(utf8Len);
- int32 nRtn = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, &*pu8.begin(), utf8Len, NULL, NULL);
- if (nRtn != utf8Len)
- {
- pu8.clear();
- return false;
- }
- return true;
- }
多字节与UTF-8、Unicode之间的转换的更多相关文章
- MultiByteToWideChar和WideCharToMultiByte用法详解, ANSI和UNICODE之间的转换
//========================================================================//TITLE:// MultiByteToW ...
- C# - 汉字与unicode之间的转换
/// <summary> /// 字符串转Unicode码 /// </summary> /// <returns>The to unicode.</ret ...
- java中unicode utf-8以及汉字之间的转换工具类
1. 汉字字符串与unicode之间的转换 1.1 stringToUnicode /** * 获取字符串的unicode编码 * 汉字"木"的Uni ...
- 举例说明Unicode 和UTF-8之间的转换
1)写这篇博客的原因 首先我要感谢这篇博客,卡了很久,看完下面这篇博客终于明白Unicode怎么转换成UTF-8了. https://blog.csdn.net/qq_32252957/article ...
- Unicode和UTF-8之间的转换
转自:http://www.cnblogs.com/xdotnet/archive/2007/11/23/unicode_and_utf8.html#undefined 最近在用VC++开发一个小工具 ...
- 汉字编码(【Unicode】 【UTF-8】 【Unicode与UTF-8之间的转换】 【汉字 Unicode 编码范围】【中文标点Unicode码】【GBK编码】【批量获取汉字UNICODE码】)
Unicode与UTF-8互转(C语言实现):http://blog.csdn.net/tge7618291/article/details/7599902 汉字 Unicode 编码范围:http: ...
- python中unicode, hex, bin之间的转换
python中unicode, hex, bin之间的转换 背景 在smb中有个feature change notify, 需要改动文件权限dacl,然后确认是否有收到notify.一直得不到这个d ...
- [Python] 中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
最近研究搜索引擎.知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前.虽然市面上讲述中文编码问题的文章数不胜数,同时以前我也讲述过PHP处理数据库服务器中文乱码问题,但是此处还是准备简单做下 ...
- CString-int-string-char-BSTR之间的转换
一.CString, int, string, char*之间的转换 string 转 CString CString.Format("%s", string.c_str());c ...
随机推荐
- 36、imageview的坑
当频繁设置imageview的背景图片时,用: imageviewChooseStaff.setImageResource(R.drawable.default_head_pic); 而不是 imag ...
- html编码和解码
public static string EncodeStr(string str) { str = Regex.Replace(str, @"<html[^>]*?>.* ...
- 软工实践第八次作业——UML设计
本次作业博客 团队组成 临时组长:何裕捷 组员:蔡子阳,陈德斌,胡青元,李麒,高裕翔,王焕仁,黄培鑫 UML 用例图 描述的部分: 1 这里是用户个人管理系统的用例图 面临的问题: 1 面临用户登录注 ...
- HLG1125 循环小数2
循环小数 II Time Limit: 1000 MS Memory Limit: 65536 K Total Submit: 155(55 users) Total Accepted: 92(51 ...
- xctf --Hctf2014 Quals write up
描述 猫流大大发现一个女神,你能告诉我女神的名字么(名字即是flag) nvshen.zip Solution: Extract the file and we could find a txt wh ...
- linux系统初始化——busybox的inittab文件格式说明
busybox的inittab文件格式说明 要写自己的inittab,需要理解busybox的inittab文件格式. busybox的inittab文件与通常的inittab不同,它没有runlev ...
- redis windows安装
下载:https://github.com/MicrosoftArchive/redis/releases 命令行启动:redis-server.exe redis.windows.conf 以服务启 ...
- mac 常用操作
1. 快速获取文件夹的位置: 打开文本 terminal 程序,将文件拖进去,路径会自己主动打印出来 2. 移动文件夹: 选中目标文件,然后使用 Command+C 复制,然后用 Command +O ...
- react 基础语法复习3- 数据传递 & 数据变化(props&&state)
react当中的数据传递是通过 props以及 state来实现的 props <Header name="kugeliu" /> Header组件当中有个name属性 ...
- JAVA神操作--使用Arthas线上热更新实战
热更不规范,同事两行泪 背景 C君是一个javaer,最近在开发用户登出接口的时候,不小心把接口参数拼错了 正确的是: /api/v1/user/logout?referrer=www.javaer. ...