前言:

  说是漫游,其实就是扯,一点一点的扯。

  话说之前参加华为的德州扑克比赛,我用C++解析消息的时候碰到一个小问题,就是定长收消息的时候出错,在Linux下调了很久很久,终于发现,sizeof(string)不是string的size,而是string类型的大小。当然,用string.size()就可以轻松解决了,而作品也在昨晚提交了,不过,交的是python的。我的C++程序,送给了两支队伍,让他们去参赛,可惜,白眼狼。

  既然有闲暇时间了,那么就要深究一下,sizeof(string)是个什么鬼,我从代码测试开始,查阅到容器的几个属性的不同,再定位到了string的几种实现,终于明白了sizeo(string)f的大小,又对引用计数产生量兴趣。下文将按照这个路线,简单的阐述一下过程与实现。

一、sizeof(string)的两个值

  先上测试代码:

  

#include <string>
#include <iostream> int main()
{
std::string first = "abcde";
std::string second = first;
std::string c; std::cout << "sizeof result of each str " << std::endl;
std::cout << "first:" << sizeof(first) << std::endl;
std::cout << "second:" << sizeof(second) << std::endl;
std::cout << "c:" << sizeof(c) << std::endl; return ;
}

  本代码是测试三种不同形式的string的大小,运行结果如下:

  

  全是28,是char*的7倍。此结果是在windows下,vs2013跑的结果。而在Linux下,g++4.6的结果是4。

  那么问题来了为什么first,second,c的sizeof都是一样大小,而又为什么在不同编译器下,值不同呢?

  首先,回答为什么first,second,c的sizeof都是一样大小。

  1、什么是sizeof。

    sizeof是一个关键字,返回对象在内存中的大小,例如sizeof(char*) = 4. 那么sizeof(string)返回的当然是string这个变量在内存(栈)中的大小了。不过为什么对于不同string,在同一平台下返回的值都是相同的。

  2、string在vs2013中实现的猜测。

    首先,string是一种容器,那么它有这容器的函数size()与capacity(),其中,size()是容器对象实际存储的对象个数,而capacity()返回的是容器对象总共可以存储的值。那么,既然sizeof(string)的返回值是char * 的7倍,那么是不是value存在一个动态内存中,而size(),capacity()等在一块呢,加上点什么,然后凑够了7倍的char *?

    经过查阅资料发现,有一种string的实现是这样的:string对象指针大小的7倍,包含:一个分配子,默认大小为15的存实际字符的value,一个size(),一个capacity(),总共:4+15+1+4+4 = 28;其中1代表字符串预留的''0',方便c_str()的实现.正好是char*的7倍。示意图如下:

                                                      

    也就是说,当字符串的有效字符少于15时,创建一个新的对象,不会导致动态内存分配,那么当字符串长度大于15呢?则在Value部分挤出一块作为指向动态内存的指针,动态内存中存实际的字符,示意图如下:

                                              

   通过对有效字符小于15的string调用capacity()发现,确实是15,而大于15的,则为会大于等于实际字符,这个与容器的内存分配策略有关。属于预分配空间的一种。至此,解决了,为什么first,second,c的sizeof返回值在同一平台下一样的问题。

   其次,解释为什么g++与vs2013下结果不同。

   原因很简单了,string在不同平台下可能存在不同的实现。既然Linux的g++下返回值是4,那么猜测它就一个指针,然后指针指向了具体的结构。经过查资料发现,至少有两种string的实现,在sizeof下都会返回4.

    1、第一种可能的实现

    这种实现是一个指针指向一个结构,然后这个结构一个地方指向有效字符,示意图如下:

                                            

    Other是一些与同步相关的数据。创建该实现的对象时,至少会导致两次内存动态分配。

    2、第二种可能的实现

    该实现比上一种直接一些,示意图如下:

                                    

     创建该对象时,只会引发一次动态内存分配。

二、“拖延症”与引用计数

细心的读者可能发现在最后两种视线中有个RefCnt。这个是引用计数,那么它是做什么用的呢?

  1、写时复制

  在后两种实现中,你当用出如下语句时 :

      

string s = s1;

s 与 s1只是pointer不同,其余的都是共享的,这样可以尽量减少构造函数与析构函数的调用。当其中一个发生变化时,被写入新值时,才会真正的创建一个实实在在的对象。Linux中的fwrite等IO都拖延症的思想,fork也是如此,这样尽量减少内存分配,构造与析构。

  2、引用计数

  由于多个指针共享同一动态内存,只有当RefCnt = 0时,才会析构内存,这样保证每个共享的字符串都是能正常工作的。Linux中文件描述符就是这样的。

参考:

  Effective STL

  

从sizeof(string)到引用计数的漫游的更多相关文章

  1. Delphi结构中使用String时遇到的内存泄露问题(没有利用String的引用计数自动销毁字符串的功能)

    先定义一个结构: TUserInfo = record  UserID: Integer; // 用户编号  UserName: string; // 用户名end; 然后编写如下代码: proced ...

  2. 【转载】C++应用引用计数技术

    原帖:http://www.cnblogs.com/chain2012/archive/2010/11/12/1875578.html 因为Windows的内核对象也运用了引用计数,所以稍作了解并非无 ...

  3. String 类的实现(3)引用计数实现String类

    我们知道在C++中动态开辟空间时是用字符new和delete的.其中使用new test[N]方式开辟空间时实际上是开辟了(N*sizeof(test)+4)字节的空间.如图示其中保存N的值主要用于析 ...

  4. String 类的实现(2)引用计数与写时拷贝

    1.引用计数 我们知道在C++中动态开辟空间时是用字符new和delete的.其中使用new test[N]方式开辟空间时实际上是开辟了(N*sizeof(test)+4)字节的空间.如图示其中保存N ...

  5. (转)C++——std::string类的引用计数

    1.概念 Scott Meyers在<More Effective C++>中举了个例子,不知你是否还记得?在你还在上学的时候,你的父母要你不要看电视,而去复习功课,于是你把自己关在房间里 ...

  6. 使用引用计数和copy-on_write实现String类

    本文写于2017-01-18,从老账号迁移到本账号,原文地址:https://www.cnblogs.com/huangweiyang/p/6295420.html 这算是我开始复习的内容吧,关于st ...

  7. swift学习笔记5——其它部分(自动引用计数、错误处理、泛型...)

    之前学习swift时的个人笔记,根据github:the-swift-programming-language-in-chinese学习.总结,将重要的内容提取,加以理解后整理为学习笔记,方便以后查询 ...

  8. C++ 引用计数技术及智能指针的简单实现

    一直以来都对智能指针一知半解,看C++Primer中也讲的不够清晰明白(大概是我功力不够吧).最近花了点时间认真看了智能指针,特地来写这篇文章. 1.智能指针是什么 简单来说,智能指针是一个类,它对普 ...

  9. swif-自动引用计数

    import UIKit /* class Person { let name: String //强引用 init(name: String) { self.name = name print(&q ...

随机推荐

  1. [C/C++] C++中new的语法规则

    int *x = new int; //开辟一个存放整数的存储空间,返回一个指向该存储空间的地址(即指针) ); //开辟一个存放整数的空间,并指定该整数的初值为100,返回一个指向该存储空间的地址 ...

  2. 多线程 调用多线程的方法 Runtime与ProcessBuilder

    一般我们使用Java运行其他类中的方法的时候,无论是静态调用还是动态调用,都是在当前的进程中执行的.也就是只有一个Java虚拟机实例在运行.有时候需要通过Java代码启动多个Java子进程,这样做会消 ...

  3. Firefox浏览器浏览自己做的网站需要输入用户名和密码解决

    我用最新的Firefox 35.0浏览我制作的网站,就会弹出这个对话框.这是什么原因?

  4. BZOJ4444 SCOI2015国旗计划(贪心+倍增)

    链上问题是一个经典的贪心.于是考虑破环成链,将链倍长.求出每个线段右边能作为后继的最远线段,然后倍增即可. #include<iostream> #include<cstdio> ...

  5. 【题解】HEOI2013Eden 的新背包问题

    这题真的神奇了……蜜汁复杂度(`・ω・´) 应该是一个比较连贯的思维方式:去掉一个物品,那么我们转移的时候不考虑它就好了呗.考虑暴力:每一次都对剩余的n - 1个物品进行多重背包转移,获得答案.既然可 ...

  6. [bzoj1062] [NOI2008]糖果雨

    Description 有一个美丽的童话:在天空的尽头有一个" 糖果国" ,这里大到摩天大厦,小到小花小草都是用糖果建造而成的.更加神奇的是,天空中飘满了五颜六色的糖果云,很快糖果 ...

  7. [洛谷P3803] 【模板】多项式乘法(FFT, NTT)

    题目大意:$FFT$,给你两个多项式,请输出乘起来后的多项式. 题解:$FFT$,由于给的$n$不是很大,也可以用$NTT$做 卡点:无 C++ Code:  FFT: #include <cs ...

  8. hdu4418 Time travel 【期望dp + 高斯消元】

    题目链接 BZOJ4418 题解 题意:从一个序列上某一点开始沿一个方向走,走到头返回,每次走的步长各有概率,问走到一点的期望步数,或者无解 我们先将序列倍长形成循环序列,\(n = (N - 1) ...

  9. [Noip2004]虫食算 dfs

    搜索问题的关键:优秀的搜索策略以及行之有效的减枝 对于这道题我们阶乘搜肯定不行所以我们按位搜,我们对每一位的三个数进行赋值,然后判解. 对于此一类的搜索乘上一个几十的常数来减枝往往要比直接搜要快得多, ...

  10. POJ 1050 To the Max 二维最大子段和

    To the MaxTime Limit: 1000MS Memory Limit: 10000KTotal Submissions: 52281 Accepted: 27633Description ...