理解BSTR数据类型 神奇的BSTR - 深蓝的日志 - 网易博客 http://blog.163.com/pugood@126/blog/static/1344175932009111111526409/

多数支持COM的语言都没法处理单以NULL结尾的字符数组(不管是否是UNICODE)。

Visual Basic, Java, VBScript, 还有 Jscript都希望字符串是固定字节长度的。

BSTR数据类型是一个UNICODE,固定字节长度,且以NULL结尾的字符串,所有的COM兼容语言都 可以使用。

虽然所有的COM兼容的语言都能使用BSTR,但它们都以自己的方式操作。VB程序员用下面的代码创建BSTR:

' VB developer made a BSTR.
'
Dim name as String
name = "Fred Flintstone"

作为C++程序员,我们使用一组COM包创建,操作BSTR数据。每个BSTR方法名都有"Sys-"前缀,用以表示是操作BSTR的(system string)。

比较有趣的是BSTR是个OLECHAR*的typedef,所以它是一个OLECHAR字符数组。

// Behold the BSTR (<wtypes.h>).
typedef OLECHAR*          BSTR;

操作BSTR的方法才是真正有区别的地方。下面我们就看一下常用的BSTR方法,了解什么时候去使用它。


在C++中创建BSTR

当你要在C++中创建BSTR的时候,你需要使用SysAllocString()。这个方法会计算字符串的长度并设置足够的缓存。例如,我们传入一个UNICODE的字符串,用bstrName变量来保持返回值:

// SysAllocString() creates a BSTR.
BSTR bstrName;
bstrName = SysAllocString(L"Fred Flintstone");

当然,多数情况下你不想使用硬代码的字符串来初始化BSTR,而使用变量。应此,你可以使用OLECHAR*变量来创建BSTR(使用OLESTR宏来确保使用正确的类型):

// Create a BSTR using an array of OLECHAR types (could be char or wchar_t).
OLECHAR* pOLEStr;     
pOLEStr = OLESTR("Fred Flinstone");
BSTR bstrName;
bstrName = SysAllocString(pOLEStr);

操作BSTR

一旦你创建了一个BSTR,你很有可能在程序中会重设它的值。使用SysReAllocString()来修改一个现有的BSTR,它会释放之前的空间,重新计算字符串的长度和设置缓存:

// Change existing bstrName to 'Mr. Slate'
SysReAllocString(&bstrName, L"Mr. Slate");

SysStringLen()方法给你计算现存BSTR缓存的长度:

// Mr. Slate == 9
int length = SysStringLen(bstrName);

重要的是,任何一个使用SysAllocString()创建BSTR必须使用SysFreeString()来清除。任何一个你从接口方法获得的BSTR也需要使用SysFreeString()来清除。

// All done with the string.
SysFreeString(bstrName);

注意:忘记使用SysFreeString()来清除BSTR会导致内存泄漏。这个的重要性就和在C++中用NEW来获得内存而忘记用DELETE删除是一样的。

额外的BSTR方法

SysAllocString(), SysStringLen(), 和 SysFreeString()方法是学习操作BSTR的好开始,BSTR的API还定义了一些其他的方法。这里列举 了<oleauto.h>中定义的所有的方法,在线帮助里有更完善的注解:

SysAllocString()
创建一个新的BSTR 。

SysReAllocString()
重新设置一个已存在的BSTR 。

SysStringLen()
返回BSTR 的长度。

SysFreeString()
销毁已存在的BSTR 。

SysReAllocStringLen()
Used to create a BSTR based on some length of characters.

SysStringByteLen()
返回BSTR的字节长度。(Win32)

SysAllocStringByteLen()
使用二进制数据来创建BSTR。你只能在不存在ANSI 到Unicode 或是Unicode 到ANSI转换的情况下使用。(Win32)

Unicode 到 ANSI转换

即使我们都能接纳BSTR(最大化的做到语言独立性),我们还有一个未解决的问题。WIN32 API的字符串参数通常都是ANSI类型。如:我们广泛使用的MessageBox()看起来是这样:

// This is the MessageBox() method we think we know...
MessageBox (HWND hWnd , LPCSTR lpText, LPCSTR lpCaption, UINT uType);

根据上面的方法原型,它看起来像是我们需要提供2个字符数组常量(LPCSTR =指向常量字符数组的长指针)。然而,现实总是很奇怪,事实上WIN32 API中根本就没有MessageBox()方法。实际上这个方法(所有包含字符串参数的WIN32方法)定义成2个可能的形式:

// Every Win32 function which takes text strings has an ANSI (A) or Unicode(W)
// variation.
#ifdef UNICODE
     #define MessageBox MessageBoxW
#else
     #define MessageBox MessageBoxA
#endif // !UNICODE

在WIN NT下,当你选择使用UNICODE编译你的当前项目时,就会定义UNICODE预处理标志(在Project | Settings菜单中选择)。在这种情况下,API中所有的方法就会自动转变成宽字符版本。例如MessageBox()会转换为下面的形式:

// Under Unicode builds, all strings come through as an array of constant wchar_t.
MessageBoxW( HWND hWnd, LPCWSTR lpText, LPCWSTR lpCaption, UINT uType);

在非UNICODE结构下,MessageBox()转变成ANSI字符版本:

// ANSI builds use const char arrays.
MessageBoxA (HWND hWnd , LPCSTR lpText, LPCSTR lpCaption, UINT uType);

我们遇到了进退两难的情况,如果我们选择UNICODE结构,我们的项目就只能在WIN NT下正确运行。如果我们选择非UNICODE结构,程序就可以运行在所有的平台上,虽然在UNICODE平台上(比如WIN NT)会执行ANSI到UNICODE的转换(意味着会降低效率)。

用于转换的方法

WIN32定义了2个很强大的方法,让你将ANSI转换成UNICODE,或是将UNICODE转换成ANSI。这2个方法给你最大的灵活性。但是鉴于他们复杂的参数,稍显难用:

? MultiByteToWideChar(): Converts an ANSI string to a Unicode equivalent.
? WideCharToMultiByte(): Converts a Unicode string to an ANSI equivalent.

还有一个选择,C的运行期库提供了较为简单,方便,且跨平台的转换方法。如果你想将UNICODE(例如BSTR)字符串转换为ANSI字符串,可以调用wcstombs()方法(Wide Character String to Multibyte String):

// wcstombs( char *ANSIString, wchar_t *UNICODEString, size_t count );
char buff[MAX_LENGTH];
BSTR bstr = SysAllocString(L"How did strings get so ugly?");
wcstombs(buff, bstr, MAX_LENGTH);          // P3 = size of target buffer.
cout << buff << endl;                      // Pump to console.
SysFreeString(bstr);

如果你想将ANSI字符串转换为UNICODE,调用mbstowcs()方法(Multi Byte String to Wide Character String):

// Transform an existing char* (ANSI) into a wchar_t* (Unicode)
mbstowcs( wchar_t *UNICODEString , char *ANSIString, size_t count );

当我们从COM转移到ATL后,我们将有一整套用于转换的宏,简化字符的转换操作,忘掉之前的4个方法。同时,ATL中的CComBSTR类将我们从复杂的字符串方法中解救出来。但是现在,我们还有很长的一段路要走,也仍然要使用那些转换的方法。

理解BSTR数据类型 神奇的BSTR的更多相关文章

  1. 关于BSTR数据类型

    关于BSTR数据类型 - 极品垃圾 - C++博客 http://www.cppblog.com/bestcln/articles/82712.html VC++常用数据类型及其操作详解(非常经典,共 ...

  2. java基础总结(1)--深入理解基本数据类型

    深入理解java数据类型 java是一种强类型语言,这就意味着必须为每一个声明变量声明一种类型.在java中,一共有8种数据类型,其中4种整型,2种浮点类型,1种字符类型和一种表示真值的boolean ...

  3. Java基础系列1:深入理解Java数据类型

    Java基础系列1:深入理解Java数据类型 当初学习计算机的时候,教科书中对程序的定义是:程序=数据结构+算法,Java基础系列第一篇就聊聊Java中的数据类型. 本篇聊Java数据类型主要包括四个 ...

  4. 深入理解redis数据类型

    转载请注明出处:https://www.cnblogs.com/wenjunwei/p/9720033.html redis的存储模型 redis不是普通的键值对存储,它实际上是一个数据结构存储服务器 ...

  5. 理解JavaScript数据类型

    JavaScript有5种基本数据类型: 数值(number):整数和小数(比如1和3.14) 字符串(string):字符组成的文本(比如"Hello World") 布尔值(b ...

  6. 一篇文章理解JS数据类型、深拷贝和浅拷贝

    前言 笔者最近整理了一些前端技术文章,如果有兴趣可以参考这里:muwoo blogs.接下来我们进入正片: js 数据类型 六种 基本数据类型: Boolean. 布尔值,true 和 false. ...

  7. VC中BSTR、Char和CString类型的转换

    1.char*转换成CString 若将char*转换成CString,除了直接赋值外,还可使用CString::format进行.例如: char chArray[] = "This is ...

  8. ATL接口返回类型&&ATL接口返回字符串BSTR*

    感觉在ATL中做COM组件,添加方法的时候,其返回值只能是HRESULT,我想返回其他数据类型,可以吗? 非也非也 HRESULT指示返回的状态,即正确与否, 返回值是这样的 HRESULT MyMe ...

  9. CString char BSTR 转换

     关于字符集不一的历史原因,可以参考: UNICODE与ANSI的区别 以下是网上转载的资料.我将辅以自己的实例,说明并总结关系. 一.CString, int, string, char*之间的转换 ...

随机推荐

  1. 特效effects

    Test中使用的特效如下 首先,使用ccg(x,y)建grid,一个Grid 属性就好像一个矩阵,是一个网络的线,组成一系列的方块和矩阵. 一个(16,12)大小的grid将会运行的非常快,但是并不会 ...

  2. asp.net kindeditor 后台取不到数据

    今晚搞了3个小时,才搞定这个破问题. 页面上使用kindeditor,提交的时候使用了LinkButton,按钮后台事件私活娶不到kineditor里的数据. 最终一步一步测试,终于发现是LinkBu ...

  3. 【快速查阅】Linux下启动和关闭Weblogic(管理服务器+被管服务器)

    Weblogic的管理服务器和被管服务器的启动.关闭,偶尔会用到,却又不常用,导致需用时却忘记了,而又重新查阅HELP. 故,以此记录,方便查阅.执行. 首先,weblogic的启动脚本和关闭脚本都在 ...

  4. flask celery 使用方法

    一.安装 由于celery4.0不支持window,如果在window上安装celery4.0将会出现下面的错误flask_clery 你现在只能安装pip install celery==3.1 二 ...

  5. shell学习笔记之条件(二)

    test或者[ #检查文件是否存在 if test -f read.c then ... fi if [ -f read.c ] then ... fi #如果then和if在同一行上,就应该用;把i ...

  6. 中文转Punycode

    package cn.cnnic.ops.udf; public class GetPunycodeFromChinese { static int TMIN = 1; static int TMAX ...

  7. rm: cannot remove `dir': Device or resource busy解决办法

    使用df查看系统发现: [ops@bs038 cm-5.4.0]$ df -hFilesystem Size Used Avail Use% Mounted on/dev/sda3 1.1T 200G ...

  8. PowerShell中进行文件读取,信息排序,分类计数。

    这是国外某大学QA的一道作业题,读取mainlog文件中的每一行信息,并获取有效的信息,也就是每条信息中第四个@后面的内容,然后进行分类与计数,要求是用Perl写,但我是用PowerShell完成的, ...

  9. JAVA面试题集---数据库方面_

    1.存储过程和函数的区别存储过程是用户定义的一系列sql语句的集合,涉及特定表或其它对象的任务,用户可以调用存储过程,而函数通常是数据库已定义的方法,它接收参数并返回某种类型的值并且不涉及特定用户表. ...

  10. 寻找最大的k个数问题

    这是编程之美书第2.5节的一道题目. 各种解法: 解法一,用nlgn复杂度的排序算法对数组进行从大到小排序,取前K个.但这方法做了两件不必要做的事:它对想得到的K个数进行了排序,对不想得到的n-K个数 ...