源码阅读笔记 - 3 std::string 与 Short String Optimization
众所周知,大部分情况下,操作一个自动(栈)变量的速度是比操作一个堆上的值的速度快的。然而,栈数组的大小是在编译时确定的(不要说 C99 的VLA,那货的 sizeof 是运行时计算的),但是堆数组的大小在运行时确定,很自由。此外,栈空间比堆空间有限,前者只有几MB,而后者基本上就是你系统内存的大小。
正因为这样,我们想组合两者的优势,既要享受堆空间的自由,又想要在数组较小的时候使用栈空间来加快速度,并且结合两者不会产生额外的开销,这时候,我们需要Short String Optimization (SSO).
一个 std::string 一般情况下把字符串存在堆空间,这样的效果就像你使用 new char [size] 来创建堆数组一样,这样可以避免字符串过长然后爆栈,但是也相对较慢,尤其是在需要拷贝的时候。为了优化,许多 std::string 的实现在内部装了一个短长度的栈数组,就像 char [20] 一样,如果你的 string 使用小于20个元素,那么就可以通过使用它来减少堆空间操作,加快速度。
实现细节
综上所述,我们的 std::string 至少保存以下信息:
- 一个短的栈数组
- 一个用来指向堆内存的指针
- 标记你的数组存在了哪
- 一个变量保存长度
You don't pay for what you don't use
如果你这么写,那就大错特错了
class string
{
public:
// 其他成员函数
private:
char* _heap;
size_t _size;
size_t _capacity;
char _stack[16];
};
对于64位系统,指针是 8 byte,size_t 是 8 byte,如果你要存一个< 16元素的字符串,那么这个类会因为没有用的 _heap 成员额外浪费 8 byte,如果存了>= 16元素的字符串,那么这个类会浪费 16 byte。一个比较好的解决方案是利用 union,让使用情况互斥的两个元素共用相同的空间。
在 MSVC 的 std::string 中,数据结构是这样的
union _Bxty
{ // storage for small buffer or pointer to larger one
value_type _Buf[_BUF_SIZE];
pointer _Ptr;
char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx; size_type _Mysize; // current length of string
size_type _Myres; // current storage reserved for string
无视那个 _Alias,我没有在代码的任何地方发现这个东西被使用的痕迹,目测是买来 dinkumware 的代码的时候就留在那里没有改了。
经过蓝色大大的教导,应该是为了让编译器允许pointer alias,蓝色大大的原话是这样的:
允许编译器做 pointer alias,其中指向这个 union 的指针可以与指向 char 的 char* 指针做 alias。而由于 char* 指针可以与任意其他类型指针做 alias,所以允许指向这个结构体的指针与任意其他类型的指针做 alias。
_BUF_SIZE = 16 / sizeof (value_type) < 1 ? 1 : 16 / sizeof (value_type)
这里保证small_buffer元素至少有一个。
基于 MSVC 的实现自己造对象串
基于 MSVC 的实现,我们只需要提供以下东西,就能用我们自己的类,使用 std::basic_string<…> 制造一个有 SSO 支持的数组
std::basic_string 的三个模板参数,分别是类本体,它的 traits,以及 allocator,traits 里面至少要包含以下函数,分别是
static void copy(MyClass* dest, const MyClass* src, size_t count); //拷贝
static void move(MyClass* dest, MyClass* src, size_t count); //移动
static void assign(MyClass& lhs, const MyClass& rhs); //赋值
static void assign(MyClass* dest, size_t count, const MyClass& value); //赋值序列
static MyClass* find(MyClass* from, size_t count, const MyClass& value); //在[from, from + count)内查找value
static int compare(MyClass* ptr, MyClass* pother, size_t count); //比较
static size_t length(MyClass* ptr); //计算长度
如果有必要,你也可以提供接受右值引用的版本。
值得一提的是你的类也需要有类似于 C 字符串用来标记结尾的特殊值,以及不能大于 16byte,否则 small buffer 里面只有一个元素,没有意义了。
然后就可以用啦。
源码阅读笔记 - 3 std::string 与 Short String Optimization的更多相关文章
- 源码阅读笔记 - 2 std::vector (1)
vector的源码真是太长了,今天用了一个下午和一个晚上看和注释了前面的一千行左右 p.s.博客园的代码高亮真是太垃圾, 如果想要阅读带注释的源码,推荐粘贴到VS2015里,然后按ctrl+z取消自动 ...
- 源码阅读笔记 - 2 std::vector (2) 关于Allocator Aware Container特性
所有的STL容器,都保存一个或默认,或由用户提供的allocator的实例,用来提供对象内存分配和构造的方法(除了std::array),这样的容器,被称作Allocator Aware Contai ...
- 源码阅读笔记 - 1 MSVC2015中的std::sort
大约寒假开始的时候我就已经把std::sort的源码阅读完毕并理解其中的做法了,到了寒假结尾,姑且把它写出来 这是我的第一篇源码阅读笔记,以后会发更多的,包括算法和库实现,源码会按照我自己的代码风格格 ...
- mxnet源码阅读笔记之include
写在前面 mxnet代码的规范性比Caffe2要好,看起来核心代码量也小很多,但由于对dmlc其它库的依赖太强,代码的独立性并不好.依赖的第三方库包括: cub dlpack dmlc-core go ...
- CI框架源码阅读笔记5 基准测试 BenchMark.php
上一篇博客(CI框架源码阅读笔记4 引导文件CodeIgniter.php)中,我们已经看到:CI中核心流程的核心功能都是由不同的组件来完成的.这些组件类似于一个一个单独的模块,不同的模块完成不同的功 ...
- CI框架源码阅读笔记3 全局函数Common.php
从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap ...
- PHP源码阅读笔记一(explode和implode函数分析)
PHP源码阅读笔记一一.explode和implode函数array explode ( string separator, string string [, int limit] )此函数返回由字符 ...
- Apollo源码阅读笔记(二)
Apollo源码阅读笔记(二) 前面 分析了apollo配置设置到Spring的environment的过程,此文继续PropertySourcesProcessor.postProcessBeanF ...
- Apollo源码阅读笔记(一)
Apollo源码阅读笔记(一) 先来一张官方客户端设计图,方便我们了解客户端的整体思路. 我们在使用Apollo的时候,需要标记@EnableApolloConfig来告诉程序开启apollo配置,所 ...
随机推荐
- dyld: Library not loaded...
Libraries and frameworks are designated as Required by default, but you can change this designation ...
- (利用tempdata判断action是直接被访问还是重定向访问)防止微信活动中用户绕过关注公众号的环节
说明:这个不是在进行微信公众号开发,也就是说在不能获取用户openid的前提下做的下面操作 1.动机:最近有个微信活动(关注了服务号的可以免费领取礼品),要做这么一个功能,活动的入口在微信服务号的菜单 ...
- 小技巧:addobject: 和 addobjectsFromArray 的区别
NSArray *array1 = [NSArray alloc]init]; NSArray *array2 = [NSArray alloc]init]; [array1 addobject: a ...
- linux学习笔记1-ubuntu的安装与基本设置
ubuntu的安装 (1) 要装ubuntu首先当然得捣鼓一台机器,当然你用虚拟机也是可以的.本人的这台DELL品牌机是从某师兄脚底下挖出来的,大概很多年没人用了,内存1.25G|||- -,但是硬盘 ...
- MSP430 IO 使用
MSP430内部上拉下拉使用注意——IO口测高低电平 MSP430单片机IO口用来检测高低电平时,是不需要外部上拉下拉的,因为其内部有上拉和下拉.在用作高低电平检测时,需要开启上拉或下拉. ...
- CSS3 transition效果 360度旋转 旋转放大 放大 移动
效果一:360°旋转 修改rotate(旋转度数) * { transition:All 0.4s ease-in-out; -webkit-transition:All 0.4s ease-in-o ...
- C#数据类型分类
C#是强类型语言,所以在定义每一个变量.常量和对象的时候都必须声明该类型. C#数据类型分为值类型.引用类型和指针类型(指针类型很少用): C#数据类型还可以分为内置类型.匿名类型和自定义类型.
- 可能是Mac环境变量恢复的参考
因为要做物联网实验的缘故,于是在Mac上用Android Studio想导入SensorSimulator的demo项目. 根据SensorSimulator的相关说明,需要先将Sensor Simu ...
- Maven修改本地仓库路径
仓库知识参考 http://www.cnblogs.com/luotaoyeah/p/3785044.html 1. 修改配置文件settings.xml 假设你的maven位置在 D:\apache ...
- [NOIP2011] 选择客栈
题目描述 丽江河边有n 家很有特色的客栈,客栈按照其位置顺序从 1 到n 编号.每家客栈都按照某一种色调进行装饰(总共 k 种,用整数 0 ~ k-1 表示),且每家客栈都设有一家咖啡店,每家咖啡店均 ...