重温《STL源码剖析》笔记 第五章
源码之前,了无秘密 ——侯杰
序列式容器 关联式容器
array(build in) RB-tree
vector set
heap map
priority-queue multiset
list multimap
slist hashtable
deque hash_set
stack(配接器) hash_map
queue(配接器) hash_multiset
hash_multimap
第五章:关联式容器
定义:所谓关联式容器,观念上类似关联式数据库,每个元素都有一个键值(可以)和一个实值(value)
关联式容器没有头尾,只有最大元素和最小元素
树中根节点至任一节点的路径长度,即所谓该节点的深度。而根节点的深度永远是0,叶子节点的高度永远
也是0(但是又有版本《数据结构与算法分析--c语言描述》、《大话数据结构》中定义的根节点深度是1,
叶子节点的高度也是1)。各执一词,瞬间不淡定了。
二叉搜索数,可提供对数时间的元素插入和访问。二叉搜索树的查找时很容易的,但是插入和移除麻烦
点,如果删除的节点有左右子节点,则将右子树的最小节点取得需要删除的节点。
平衡二叉搜索树:
AVL Tree:任何节点的左右子树高度相差最多1
RB-tree(红黑树):一颗特殊的二叉搜索树
必须满足:1.每个节点要么是红要么是黑
2.根节点必须是黑色的
3.如果节点为红,其子节点必须为黑
4.任一节点至NULL(树尾端)的任何路径,所含之黑节点数必须相同。
其他关于树和红黑树请查看另一篇博客: 树
set:所有的元素都会根据元素的键值自动被排序,set元素的键值就是实值,实值就是键值。
set不允许两个元素有相同的键值。
不可以通过set的迭代器改变set的元素值,因为set的元素值就是其键值,关系到set
元素的排序规则,如果任意改变set元素值,会严重破坏set组织。
set以RB-tree为底层机制,几乎所有的set操作都只是转调用RB-tree的操作行为。
map:
map的所有元素都是pair,同时拥有实值和键值。pair的第一元素被视为键值,第二元素被
视为实值。map也不允许两个元素拥有相同的键值。
map以RB-tree为底层机制,几乎所有的mapt操作都只是转调用RB-tree的操作行为。
multiset:
multiset的特性以及用法和set完全相同,唯一的差别在于它允许键值重复,因此它的
插入操作采用的是底层机制RB-tree的insert_equal()而非insert_unique()
multimap:
multimap的特性以及用法和map完全相同,唯一的差别在于它允许键值重复,因此它的
插入操作采用的是底层机制RB-tree的insert_equal()而非insert_unique()
hashtable
二叉搜索树具有对数时间的表现,但这样的表现是基于一个输入数据有足够的随机性。而
hashtable(散列表)的数据结构,在插入,删除,搜寻等操作上也具有常数平均时间的表现。
使用hash function 会导致可能有不同的元素被映射到相同的位置(亦具有相同的索引)
导致了碰撞问题。
解决碰撞问题的方法有很多种:线性探测,二次探测,开链(STL使用)
线性探测:容易导致主集团(primary clustering)的产生 (H+1,H+2,,,,H+i)
对于碰撞一般采取的措施是如果计算出来的位置上已经有元素值了则
循序往下一一寻找,直到没有元素为止。而进行元素搜寻时,如果计算出来的位置
上的元素值与我们的搜寻目标不符,就循序向下一一寻找,直到找到吻合值,或者
直到遇上空格元素。而元素的删除则必须采用惰性删除,只标记删除几号,实际删
除操作则待表格重新整理时再进行。(主要是因为hash table中的每一个元素不仅
表述它自己,也关系到其他元素的安排。
二次探测:(主要用来解决主集团的问题)(H+1^2,H+2^2,,,,H+i^2)
表格负载:假设表格的大小为质数,而且永远保持负载系数在0.5一下(也就是说超过
0.5就重新配置并重新整理表格),那么就可以确定每插入一个新元素所需要的
探测次数不多于2。
表容量28个质数{53、97、193、389、769、1543、3079、6151...}
Hi=H0 + i^2(mod M)
H(i-1)=H0 + (i - 1)^2(Mod M)
整理可得:
Hi=H(i-1) + 2i -1(Mod M)
开链法:在每一个表格元素中维护一个list;hash function 为我们分配某一个list
然后在list上执行元素的插入,搜寻,删除等操作。
开链法的表格重建与否的判断原则是:元素个数(包括新增元素)和bucket
vector的大小来比。如果前者大于后者,就重建表格。
hash_set:几乎所有的操作行为都是转调用hasht_table的操作工作。
RB-tree有自动排序功能而hashtable没有,反应出来的结果就是,
set的元素有自动排序功能而hash_set没有。
hash_map:
RB-tree有自动排序功能而hashtable没有,反应出来的结果就是,
set的元素有自动排序功能而hash_map没有。
hash_multiset:
与multiset完全相同,唯一的差别就是他的底层机制是hashtable,
因此hash_multiset的元素不会自动排序。
而hash_multiset与hash_set实现的唯一的差别在于,前者元素插入操作
采用底层机制hashtable的insert_equal(),后者则是采用insert_unique()
hash_multimap:
与multimap完全相同,唯一的差别就是他的底层机制是hashtable,
因此hash_multimap的元素不会自动排序。
而hash_multimap与hash_map实现的唯一的差别在于,前者元素插入操作
采用底层机制hashtable的insert_equal(),后者则是采用insert_unique()
重温《STL源码剖析》笔记 第五章的更多相关文章
- 《STL源码剖析》——第五、六:关联容器与算法
第五章.关联容器 5.0.关联容器 标准的STL关联式容器分为set(集合)和map(映射表)两大类,以及这两大类的衍生体multiset(多键集合)和multimap(多键映射表).这些容器的底层 ...
- 《STL源码剖析》——第四章、序列容器
1.容器的概观与分类 所谓序列式容器,其中的元素都可序(ordered)[比如可以使用sort进行排序],但未必有序(sorted).C++语言本身提供了一个序列式容器array,STL另外再提供v ...
- STL源码剖析读书笔记之vector
STL源码剖析读书笔记之vector 1.vector概述 vector是一种序列式容器,我的理解是vector就像数组.但是数组有一个很大的问题就是当我们分配 一个一定大小的数组的时候,起初也许我们 ...
- c++ stl源码剖析学习笔记(一)uninitialized_copy()函数
template <class InputIterator, class ForwardIterator>inline ForwardIterator uninitialized_copy ...
- 《STL源码剖析》读书笔记
转载:https://www.cnblogs.com/xiaoyi115/p/3721922.html 直接逼入正题. Standard Template Library简称STL.STL可分为容器( ...
- 通读《STL源码剖析》之后的一点读书笔记
直接逼入正题. Standard Template Library简称STL.STL可分为容器(containers).迭代器(iterators).空间配置器(allocator).配接器(adap ...
- 面试题总结(三)、《STL源码剖析》相关面试题总结
声明:本文主要探讨与STL实现相关的面试题,主要参考侯捷的<STL源码剖析>,每一个知识点讨论力求简洁,便于记忆,但讨论深度有限,如要深入研究可点击参考链接,希望对正在找工作的同学有点帮助 ...
- STL"源码"剖析-重点知识总结
STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略多 :) 1.STL概述 STL提供六大组件,彼此可以组合 ...
- 【转载】STL"源码"剖析-重点知识总结
原文:STL"源码"剖析-重点知识总结 STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点 ...
- STL"源码"剖析
STL"源码"剖析-重点知识总结 STL是C++重要的组件之一,大学时看过<STL源码剖析>这本书,这几天复习了一下,总结出以下LZ认为比较重要的知识点,内容有点略 ...
随机推荐
- 【leetcode77】Single Number
一题目描述: 给定一个数组,只有一个数字出现一次,其余都是两次,判断那个数字 思路: 不断取出数据进行异或,最后一个数字,因为相同的数字会抵消 代码: public class Solution { ...
- H5学习之旅-H5的新特性(1)
随着H5的发展,网页开发呈现了跨平台的特性,目前H5是兼容各大平台的,这也为一些其他的技术的跨平台开发提供了基础,所以我预测后H5会成为很重要的开发语言 新特性介绍 1.用于回话的canvas标签 2 ...
- React Native之样式
样式 React Native 不实现 CSS,而是依赖于 JavaScript 来为你的应用程序设置样式.这是一个有争议的决定,你可以阅读那些幻灯片,了解背后的基本原理. 声明样式 在 React ...
- (五十六)iOS多线程之NSOperation
NSOpertation是一套OC的API,是对GCD进行的Cocoa抽象. NSOperation有两种不同类型的队列,主队列和自定义队列. 主队列运行于主线程上,自定义队列在后台运行. [NSBl ...
- GIT版本控制 — GIT与SVN的相互转换 (三)
git-svn git-svn用于Git和SVN的转换,可以把Git仓库迁移成SVN仓库,反之亦可. 详细介绍可见[1],或者命令行输入git-svn. Bidirectional operation ...
- 基于VB中WINSOCK控件的网上象棋系统的实现
本文发表在<微型机与应用>杂志2001年第3期. 基于VB中WINSOCK控件的网上象棋系统的实现 马根峰1 , 孙艳2 , 王平1 (1.重庆邮电学院自动化学院,重庆,40006 ...
- SpriteBuilder使用Shader Effect的另一种方法
记住你并不是必须要使用Effect节点去给一个特定的精灵应用效果. 你只要选择一个精灵然后切换至项目属性窗口(Item Properties tab),找到effects用户接口在CCSprite属性 ...
- g++和gcc的相同点和区别
gcc和g++的区别和联系 gcc和g++都是GNU(一个组织)的编译器. 1.对于.c后缀的文件,gcc把它当做是C程序:g++当做是C++程序: 2.对于.cpp后缀的文件,gcc和g++都会当做 ...
- Erlang cowboy http request生命周期
Erlang cowboy http request生命周期 翻译自: http://ninenines.eu/docs/en/cowboy/1.0/guide/http_req_life/ requ ...
- myBatis源码学习之SqlSession
在上一篇文章中SqlSessionFactory介绍了生产SqlSession的工厂,SqlSession是一个接口其具体实现类为DefaultSqlSession,SqlSession接口主要定义了 ...