Unicode转为UTF8

Unicode转换为UTF8

要说这个转换也简单，使用WideCharToMultiByte两次或者直接一次就可以转换。今天在弄VLC的时候，由于VLC的视频文件名使用UTF8编码，因此当路径中包含中文的时候(其播放函数的参数为char*)，直接使用 char*(ANSI) 或者用WCHAR*(UNICODE) 将UNICODE转为ANSI的char*都不行。

有事上网查得知VLC用了UTF8，英文数字用都用1个字节，中文用3个字节来编码。

于是很容易想到用WideCharToMultiByte(CP_UTF8,...)来转换，于是开始动手搞：

const char* Unicode2UTF8(const WCHAR* wszString)

{

    //预转换，得到所需空间的大小，这次用的函数和上面名字相反

    int u8Len = ::WideCharToMultiByte(CP_UTF8, NULL, wszString, -, NULL, , NULL, NULL);

    //同上，分配空间要给'\0'留个空间

    //UTF8虽然是Unicode的压缩形式，但也是多字节字符串，所以可以以char的形式保存

    char* szU8 = new char[u8Len + ];

    if(NULL == szU8) return NULL;

    ZeroMemory(szU8, sizeof(char) * (u8Len + ));

    //转换

    //unicode版对应的strlen是wcslen

    ::WideCharToMultiByte(CP_UTF8, NULL, wszString, -, szU8, u8Len + , NULL, NULL); 

    return szU8;

}

单步调试的时候发现：最后的szU8中，路径中的中文为乱码！上网查，得知在单步调试的时候，调试器看到char*还会认为是ANSI，所以用ANSI编码来解读，所以看到的是乱码。

所以直接使用了此代码，发现报【断言失败】，看不出在哪里断言失败的。

经过查看代码发现是在ASSERT(PathFileExists(lpFileName))这里报断言失败，即不存在此文件！

于是一(ˇ?ˇ) 想， 这里的lpFileName为转换后的UTF8的编码，那就先把此行注释掉，把检测文件是否存在的操作放到Unicode2UTF8之前。

改过后：一切正常！

Unicode转为UTF8的更多相关文章

Python+requests r.json()获取的内容，控制台显示中文Unicode转为utf-8《九》
在接口测试中,直接使用r.json()获取到的结果,难免会在结果中带有中文,但是在控制台的中文输出默认是Unicode编码,不能通过统一在设置中进行设置utf-8,因此为了在控制台更显而易见的显示出中 ...
php将unicode编码转为utf-8方法
介绍在前端开发中,为了让中文在不同的环境下都能很好的显示,一般是将中文转化为unicode格式,即\u4f60,比如:"你好啊"的 unicode编码为"\u4f60\ ...
String 字符串中含有 Unicode 编码时，转为UTF-8
1.单纯的Unicode 转码 String a = "\u53ef\u4ee5\u6ce8\u518c"; a = new String(a.getBytes("UTF ...
[Python] 中文编码问题：raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
最近研究搜索引擎.知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前.虽然市面上讲述中文编码问题的文章数不胜数,同时以前我也讲述过PHP处理数据库服务器中文乱码问题,但是此处还是准备简单做下 ...
Unicode与UTF8相互转化（使用MultiByteToWideChar）
1.简述最近在发送网络请求时遇到了中文字符乱码的问题,在代码中调试字符正常,用抓包工具抓的包中文字符显示正常,就是发送到服务器就显示乱码了,那就要将客户端和服务器设置统一的编码(UTF-8),而我们 ...
字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
转载:http://witmax.cn/character-encoding-notes.html 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问 ...
字符编码终极笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
1.字符编码.内码,顺带介绍汉字编码字符必须编码后才能被计算机处理.计算机使用的缺省编码方式就是计算机的内码.早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB231 ...
java爬取网页Unicode转UTF-8中文
unicode编码简而言之就是将每一个字符用16位2进制数标识.但是通常都用4位的16进制数标识. 例如: 1)中文字符串"你好"的unicode码为:\u60\u597d; 2) ...
字符编码笔记：ASCII，Unicode和UTF-8（转载）
注:我注释的地方有 add by zhj.另Unicode.UTF-8.GB2312查询http://www.2fz1.com/so/ 在python中,a.decode(xxx)就是把str类型的字 ...

随机推荐

net中使用母版页
.net中使用母版页的优点母版页提供了开发人员已通过传统方式创建的功能,这些传统方式包括重复复制现有代码.文本和控件元素:使用框架集:对通用元素使用包含文件:使用 ASP.NET 用户控件等.母版页 ...
Unix编程之size_t、ssize_t
http://blog.csdn.net/lalor/article/details/7426184 首先,我非常肯定以及确定的告诉你ssize_t是有符号整型,在32位机器上等同与int,在64位 ...
GC垃圾回收之GC.KeepAlive方法
http://msdn.microsoft.com/zh-cn/library/system.gc.keepalive.aspx http://www.cnblogs.com/ren700622/ar ...
json的数据格式（仔细查看）
1.json对象就是jsonObject,jsonobject里可以放入很多键值对,并以逗号为分隔符. jsonObject里还可以嵌套JsonObject对象,或者数组信息作为value,数组作为k ...
ios开发图片点击放大
图片点击放大,再次点击返回原视图.完美封装,一个类一句代码即可调用.IOS完美实现创建了一个专门用于放大图片的类,以下为.h文件 #import <Foundation/Foundation. ...
2014-9-17二班----10 web project
package cn.rwkj.servlet; import java.io.IOException; import javax.servlet.ServletException; import j ...
WCF入门（四）---WCF架构
WCF是一个分层架构,为开发各种分布式应用的充分支持.该体系结构在下面将详细说明. 约定约定层旁边就是应用层,并含有类似于现实世界的约定,指定服务和什么样的信息可以访问它会使操作的信息.约定基本都是 ...
【原创】30分钟入门 github
很久没更新了,这篇文章重点在github的入门使用,读者可以下载github for windows shell,边看边操作,加深印象. 好了,30分钟的愉快之旅开始吧: 一.github使用的注意事 ...
字符设备 register_chrdev_region()、alloc_chrdev_region() 和 register_chrdev()
1. 字符设备结构体内核中所有已分配的字符设备编号都记录在一个名为 chrdevs 散列表里.该散列表中的每一个元素是一个 char_device_struct 结构,它的定义如下: static ...
Codeforces 4538 （状态压缩dp）Little Pony and Harmony Chest
Little Pony and Harmony Chest 经典状态压缩dp #include <cstdio> #include <cstring> #include < ...

Unicode转为UTF8

Unicode转为UTF8的更多相关文章

随机推荐

热门专题