散列表（Hash table，也叫哈希表）

joey周琦 2024-10-21 15:02:20 原文

散列表是根据关键字（Key value）而直接访问在内存存储位置的数据结构。也就是说，它通过把键值通过一个函数的计算，映射到表中一个位置来访问记录，这加快了查找速度。这个映射函数称做散列函数，存放记录的数组称做散列表。

散列表是普通数组概念的推广，它支持insert,search,delete操作。在实践中，它的效率还是很高的，在一些合理的假设下，在散列表中查找一个元素的期望时间为O(1).

1直接寻址表

如下图，在关键字全域U,比较小时，直接寻址是一种简单而有效的技术。

其实操作类似于数组了，只不过索引是key(关键字）。这时的操作比较简单如下：

2散列表（哈希表）

直接寻址有个明显的问题，如果域U很大，在计算机内存有限的限制下，实现它就不实际了。因为K相对于U很小，分配给T的空间大部分都浪费了。

所以在哈希表中，我们加入散列函数，就是把从实际关键字k,映射到散列表[0…M-1]的槽位上。这样空间开销就从|U|缩减到了M.

但是这样会带来问题，就是碰撞(collision),因为是多对少的映射，碰撞不可避免。

解决碰撞的方法之一是链接法(chaining)：把散列到同一槽中的所有元素都放在一个链表中。如下图：

3散列表的性能分析

若给定一个能存放n个元素的，具有m个槽位的散列表T.若用链接法，最坏的情况效果会很差，所有元素都被映射到一个槽里面。所以我们要求映射函数h,要将所有的关键字均匀分布在m个槽位上。

假设，任何元素散列到m个槽中的每个槽是等可能性，且相互独立的。称这个假设为简单一致散列（simple uniform hashing).

在上面的假设下，且n=O(m).在散列表中所有操作的期望时间为O(1).

4散列函数的选择

好的散列函数应尽可能满足，简单一致散列的假设。

4.1除法散列法

通过取k除以m的余数，将关键字映射到m个槽中去，即

h(k)=k mod m

m不应该是是2的整数次幂。若m=2^p,则h(k)就是k的p个最低位数字，我们不清楚关键字的p最低位是否均匀，所以m应该尽量选择不太接近2的整数幂的质数。

4.2乘法散列法

用关键字k乘以常数A,并且抽出kA的小数部分，然后用m乘以这个值，再取底floor.即：

h(k)=floor( m( k*A mod 1) )

乘法散列，m没有太多限制，一般取2的整数次幂，A一般取，(sqrt(5)-1)/2.

4.3全域散列（universal hashing):

随机的选择散列函数，使之独立于要存储的关键字，这种方法称为全域散列。这样无论关键字怎么选，其平均性能都很好（思想类似于随机快速排序，为了避免最坏的情况，让最后一个数字与前面的随机交换）。

5开放寻址法（open addressing)

未完待续

散列表（Hash table，也叫哈希表）的更多相关文章

散列表(has table、哈希表)
一. 散列表是什么是包含映射关系的一种数据结构,可以提高查找效率. 二. 散列函数 1)必须是一致的.假设输入一个单词“banana”,映射的数字是1,那么以后每次输入banana都要映射到数字1, ...
Java 集合散列表hash table
Java 集合散列表hash table @author ixenos 摘要:hash table用链表数组实现.解决散列表的冲突:开放地址法和链地址法(冲突链表方式) hash table 是 ...
散列表(Hash Table)
散列表(hash table): 也称为哈希表. 根据wikipedia的定义:是根据关键字(Key value)而直接访问在内存存储位置的数据结构.也就是说,它通过把键值通过一个函数的计算,映射到表 ...
散列表(Hash table)及其构造
散列表(Hash table) 散列表,是根据关键码值(Key value)而直接进行访问的数据结构.它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.这个映射函数叫做散列函数,存放记录 ...
[转载] 散列表(Hash Table)从理论到实用（上）
转载自:白话算法(6) 散列表(Hash Table)从理论到实用(上) 处理实际问题的一般数学方法是,首先提炼出问题的本质元素,然后把它看作一个比现实无限宽广的可能性系统,这个系统中的实质关系可以通 ...
[转载] 散列表(Hash Table)从理论到实用（中）
转载自:白话算法(6) 散列表(Hash Table)从理论到实用(中) 不用链接法,还有别的方法能处理碰撞吗?扪心自问,我不敢问这个问题.链接法如此的自然.直接,以至于我不敢相信还有别的(甚至是更好 ...
[转载] 散列表(Hash Table) 从理论到实用（下）
转载自: 白话算法(6) 散列表(Hash Table) 从理论到实用(下) [澈丹,我想要个钻戒.][小北,等等吧,等我再修行两年,你把我烧了,舍利子比钻戒值钱.] ——自扯自蛋无论开发一个程序还 ...
算法导论-散列表(Hash Table)-大量数据快速查找算法
目录引言直接寻址散列寻址散列函数除法散列乘法散列全域散列完全散列碰撞处理方法链表法开放寻址法线性探查二次探查双重散列随机散列再散列问题完整源码(C++) 参考资料内 ...
散列表(hash table)——算法导论(13)
1. 引言许多应用都需要动态集合结构,它至少需要支持Insert,search和delete字典操作.散列表(hash table)是实现字典操作的一种有效的数据结构. 2. 直接寻址表在介绍散列 ...
建立简单的Hash table（哈希表）by C language
#define SIZE 1000 //定义Hash table的初始大小 struct HashArray { int key; int count; struct HashArray* next; ...

随机推荐

Java调用外部程序常用算法和封装类
一个项目不可能只使用一种编程语言来开发,也不可能由一个人开发,所以,Java程序员要学会和使用其他编程语言的程序员合作.那么,让我来发布一个工具类--Java外接程序扩展包,并将相应算法发布.Java ...
java.util.HashSet源码分析
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java. ...
WinForm多线程及委托防止界面假死
当有大量数据需要计算.显示在界面或者调用sleep函数时,容易导致界面卡死,可以采用多线程加委托的方法解决. using System; using System.Collections.Generi ...
Swift - 手势识别
override func viewDidLoad() { super.viewDidLoad() var swipeRight = UISwipeGestureRecognizer(target: ...
s3c-u-boot-1.1.6源码分析
源码源码结构移植准备
UIView局部点击(转)
今天上班遇到一种情况,需要局部响应点击事件,比如在一个UIImageView中设置一个小圆圈图片,要求点击圆圈里面不响应点击,点击小圆圈外面的部分响应点击.可以通过重写hitTest:withEv ...
C# json to dynamic object
dynamic obj = Newtonsoft.Json.JsonConvert.DeserializeObject(json); string greeting = obj.greeting; R ...
python总字符串
前面我们讲解了什么是字符串.字符串可以用''或者""括起来表示. 如果字符串本身包含'怎么办?比如我们要表示字符串 I'm OK ,这时,可以用" "括起来表示 ...
C# - dynamic 类型
C#4引入dynamic关键字,定义变量时,可以不初始化它的值. dynamic类型仅在编译期间存在,在运行期间会被System.Object类型替代. dynamic myDynamicVar; m ...
s3c2440之cache
cache高速缓冲存储器注意与块设备页高速缓存进行区别,一个是硬件的实现一个是软件的实现,块设备页高速缓存. s3c2440/s3c2410里面主要有一个arm920t的核,但同时包含几个协处理器,协 ...