【STL】关联容器

C++ 11哈希表已被列入标准列。hashtable这是hash_set、hash_map、hash_multiset、hash_multimap的底层机制。即这四种容器中都包括一个hashtable。

解决碰撞问题的办法有很多，线性探測、二次探測、开链等等。SGI STL的hashtable採用的开链方法，每一个hash table中的元素用vector承载，每一个元素称为桶（bucket），一个桶指向一个存储了实际元素的链表（list），链表节点（node）结构例如以下：

template <class Value>

struct __hashtable_node

{

  __hashtable_node* next;

  Value val;     // 存储实际值

};

再来看看hash table的迭代器定义：

template <class Value, class Key, class HashFcn,

          class ExtractKey, class EqualKey, class Alloc>

struct __hashtable_iterator {         // 迭代器

  typedef hashtable<Value, Key, HashFcn, ExtractKey, EqualKey, Alloc>

          hashtable;

  ....

  typedef __hashtable_node<Value> node;

  // 定义迭代器对应类型

  typedef forward_iterator_tag iterator_category;     // 前向迭代器

  typedef Value value_type;

  typedef ptrdiff_t difference_type;

  typedef size_t size_type;

  typedef Value& reference;

  typedef Value* pointer;

  node* cur;      // 迭代器眼下所指节点

  hashtable* ht;  // 和hashtable之间的纽带

  __hashtable_iterator(node* n, hashtable* tab) : cur(n), ht(tab) {}

  __hashtable_iterator() {}

  reference operator*() const { return cur->val; }

  pointer operator->() const { return &(operator*()); }

  iterator& operator++();

  iterator operator++(int);

  bool operator==(const iterator& it) const { return cur == it.cur; }

  bool operator!=(const iterator& it) const { return cur != it.cur; }

};

hash table的迭代器不能后退，这里关注迭代器的自增操作。代码例如以下：

template <class V, class K, class HF, class ExK, class EqK, class A>

__hashtable_iterator<V, K, HF, ExK, EqK, A>&

__hashtable_iterator<V, K, HF, ExK, EqK, A>::operator++() // 注意类模板成员函数的定义

{

  const node* old = cur;

  cur = cur->next;  // 移动到下一个node

  if (!cur) {       // 到了list结尾

    size_type bucket = ht->bkt_num(old->val);     // 依据节点值定位旧节点所在桶号

    while (!cur && ++bucket < ht->buckets.size()) // 计算下一个可用桶号

      cur = ht->buckets[bucket];    // 找到，另cur指向新桶的第一个node

  }

  return *this;

}

hashtable数据结构内容非常多，这里仅仅列出少量代码：

template <class Value, class Key, class HashFcn,

          class ExtractKey, class EqualKey,

          class Alloc>

class hashtable {   // hash table数据结构

public:

  typedef Key key_type;

  typedef Value value_type;

  typedef HashFcn hasher;          // 散列函数类型

  typedef EqualKey key_equal;

  typedef size_t            size_type;

  typedef ptrdiff_t         difference_type;

  ....

private:

  hasher hash;          // 散列函数

  key_equal equals;     // 推断键值是否相等

  ExtractKey get_key;   // 从节点取出键值

  typedef __hashtable_node<Value> node;

  typedef simple_alloc<node, Alloc> node_allocator; // 空间配置器

  vector<node*,Alloc> buckets;  // 桶的集合，能够看出一个桶实值上是一个node*

  size_type num_elements;      // node个数

  ....

}

SGI STL将hash table的大小，也就是vector的大小设计为28个质数，并存放在一个数组中：

static const int __stl_num_primes = 28; // 28个质数

static const unsigned long __stl_prime_list[__stl_num_primes] =

{

  53,         97,         193,       389,       769,

  1543,       3079,       6151,      12289,     24593,

  49157,      98317,      196613,    393241,    786433,

  1572869,    3145739,    6291469,   12582917,  25165843,

  50331653,   100663319,  201326611, 402653189, 805306457,

  1610612741, 3221225473, 4294967291

};

当vector容量不足时，会以两倍的容量进行扩充。

以下介绍插入操作。以insert_unique为例：

// 插入新元素。键值不能反复

  pair<iterator, bool> insert_unique(const value_type& obj)

  {

    resize(num_elements + 1);           // 推断vector是否须要扩充

    return insert_unique_noresize(obj); // 直接插入obj

  }

insert操作大致分两步：第一步是扩充（假设须要的话），第二步是插入。

resize代码例如以下：

template <class V, class K, class HF, class Ex, class Eq, class A>

void hashtable<V, K, HF, Ex, Eq, A>::resize(size_type num_elements_hint)  // 推断是否须要扩充vector

{

  const size_type old_n = buckets.size();

  if (num_elements_hint > old_n)

  {  // 元素个数大于vector容量，则须要扩充vector

    const size_type n = next_size(num_elements_hint);

    if (n > old_n)

    {

      vector<node*, A> tmp(n, (node*) 0); // 建立一个暂时的vector作为转移目的地

      for (size_type bucket = 0; bucket < old_n; ++bucket)

      {  // 一个桶一个桶进行转移

        node* first = buckets[bucket];

        while (first)

        {   // 一个节点一个节点进行转移

            size_type new_bucket = bkt_num(first->val, n);  // 散列过程，对n取模

            buckets[bucket] = first->next;

            first->next = tmp[new_bucket];  // 这一句和下一句表示从链表前端插入

            tmp[new_bucket] = first;

            first = buckets[bucket];        // first指向旧vector的下一个node

        }

        buckets.swap(tmp);  // 两个vector的内容互换。使buckets彻底改变

      }

    }

  }

}

上述代码基本思路就是：先扩充，再移动。最后交换。

扩充利用next_size函数。next_size的作用就是从质数表中选取最接近而且不小于num_elements_hint的质数并返回，利用这个较大值开辟一个新vector。
移动实质上就是指针的移动。又一次对每一个节点进行散列，然后从前链入到新的vector中。
交换过程就是上面代码红色部分。这里使用了vector内部的swap成员函数，将*this和tmp的内容进行了互换。这是copy-and-swap技术。《Effective C++》条款11有说明这个技术。扩充完vector后，就能够顺利插入须要插入的元素了。

insert_unique_noresize代码例如以下：

template <class V, class K, class HF, class Ex, class Eq, class A>

pair<typename hashtable<V, K, HF, Ex, Eq, A>::iterator, bool>                 // 注意，返回一个pair

hashtable<V, K, HF, Ex, Eq, A>::insert_unique_noresize(const value_type& obj) // 直接插入节点，无需扩充

{

  const size_type n = bkt_num(obj); // 对obj进行散列，然后模上vector大小，从而确定桶号

  node* first = buckets[n];         // first指向相应桶的第一个node

  for (node* cur = first; cur; cur = cur->next)

    if (equals(get_key(cur->val), get_key(obj)))  // 遇到同样node。则直接返回这个node

      return pair<iterator, bool>(iterator(cur, this), false);

  // 没有遇到同样node，则在list开头插入

  node* tmp = new_node(obj);

  tmp->next = first;

  buckets[n] = tmp;

  ++num_elements;

  return pair<iterator, bool>(iterator(tmp, this), true);

}

这里也是将新节点插入list的开头，具体过程已在凝视中说明。

參考：

《STL源代码剖析》 P253.

【STL】关联容器 — hashtable的更多相关文章

STL关联容器
这里简单学习一下STL关联容器,主要是map.multimap.set.multiset以及unordered_map.前四个底层实现都是利用红黑树实现的,查找算法时间复杂度为\(O(log(n))\ ...
STL关联容器的基本操作
关联容器 map,set map map是一种关联式容器包含键/值 key/value 相当于python中的字典不允许有重复的keymap 无重复,有序 Map是STL的一个关联容器,它提供一对一 ...
STL关联容器总结
有序的都不带unordered,即如下: set multiset map multimap 其中带multi的表示关键字可以重复无序的带unordered,如下: unordered_map un ...
STL关联容器值hashtable
hashtable(散列表)是一种数据结构,在元素的插入,删除,搜索操作上具有常数平均时间复杂度O(1); hashtable名词散列函数:负责将某一元素映射为索引. 碰撞(collision):不 ...
STL 笔记（二）关联容器 map、set、multimap 和 multimap
STL 关联容器简单介绍关联容器即 key-value 键值对容器,依靠 key 来存储和读取元素. 在 STL 中,有四种关联容器,各自是: map 键值对 key-value 存储,key 不可 ...
STL List容器
转载http://www.cnblogs.com/fangyukuan/archive/2010/09/21/1832364.html 各个容器有很多的相似性.先学好一个,其它的就好办了.先从基础开始 ...
STL——关联式容器
一.关联式容器标准的STL关联式容器分为set(集合)/map(映射表)两大类,以及这两大类的衍生体multiset(多键集合)和 multimap(多键映射表).这些容器的底层机制均以RB-tre ...
STL之关联容器的映射底层
STL的关联容器有set, map, multiset, multimap.用于实现它们的底层容器有划入标准的rb_tree和待增加标准的hashtable. 底层容器rb_tree为上层容器提供了一 ...
《STL源码剖析》——第五、六：关联容器与算法
第五章.关联容器 5.0.关联容器标准的STL关联式容器分为set(集合)和map(映射表)两大类,以及这两大类的衍生体multiset(多键集合)和multimap(多键映射表).这些容器的底层 ...

随机推荐

Dll的链接使用细节
关于Dll Dll.Exe 都是PE格式的二进制文件. Dll相当于Linux操作系统下的so文件 1 基地址(Base Address)和相对地址(RelativeVirtual Address) ...
usart和uart 的区别
摘自:https://blog.csdn.net/meic51/article/details/7714847 什么是同步和异步转自https://blog.csdn.net/seashine_ya ...
HDU 1405 The Last Practice 数学水题
http://acm.hdu.edu.cn/showproblem.php?pid=1405 题目大意: 给你一个数,让你分解素因子,输出它的各次幂. 如60 输出:2 2 3 1 5 1 (60=2 ...
angular内置指令相关知识
原文地址 https://www.jianshu.com/p/5a5b43a8e91f 大纲 1.angular指令的分类 2.angular指令之——组件 3.angular指令之——属性指令 (n ...
[Now] Deploy a Node project with Zeit’s Now
Use Zeit’s now to deploy a node application from your local machine to a remote cloud service in mom ...
Loader之一：基本原理分类： H1_ANDROID 2013-11-16 10:29 1923人阅读评论(0) 收藏
参考APIDEMO及http://developer.android.com/guide/components/loaders.html#app 1.Introduced in Android 3.0 ...
【C#】万事开头难（二）<机房重构>
前言机房将要进行完了,之所以仍然使用这个题目,是由于我想告诉自己.无论面对多么未知的事物.不要害怕,去做就好.在这么多天的机房重构中,发现了好多问题,也攻克了好多问题,今天,就把我解决的问题分享给大 ...
HOOK API入门之Hook自己程序的MessageBoxW（简单入门）
说到HOOK,我看了很多的资料和教程,无奈就是学不会HOOK,不懂是我的理解能力差,还是你们说的不够明白,直到我看了以下这篇文章,终于学会了HOOK: http://blog.sina.com.cn ...
Quartz.NET 3.0.7 + MySql 实现动态调度作业+动态切换版本+多作业引用同一程序集不同版本+持久化+集群(一)
原文:Quartz.NET 3.0.7 + MySql 实现动态调度作业+动态切换版本+多作业引用同一程序集不同版本+持久化+集群(一) 前端时间,接到领导任务,写了一个调度框架.今天决定把心路历程记 ...
[Grid Layout] Specify a grid gutter size with grid-gap
It’s beautifully straightforward to add a gutter to our grid layout. Let’s apply one with grid-gap.

【STL】关联容器 — hashtable

【STL】关联容器 — hashtable的更多相关文章

随机推荐

热门专题