散列表 (Hash table,也叫哈希表)
散列表是根据关键字(Key value)而直接访问在内存存储位置的数据结构。也就是说,它通过把键值通过一个函数的计算,映射到表中一个位置来访问记录,这加快了查找速度。这个映射函数称做散列函数,存放记录的数组称做散列表。
散列表是普通数组概念的推广,它支持insert,search,delete操作。在实践中,它的效率还是很高的,在一些合理的假设下,在散列表中查找一个元素的期望时间为O(1).
1直接寻址表
如下图,在关键字全域U,比较小时,直接寻址是一种简单而有效的技术。

其实操作类似于数组了,只不过索引是key(关键字)。这时的操作比较简单如下:

2散列表(哈希表)
直接寻址有个明显的问题,如果域U很大,在计算机内存有限的限制下,实现它就不实际了。因为K相对于U很小,分配给T的空间大部分都浪费了。
所以在哈希表中,我们加入 散列函数,就是把从实际关键字k,映射到散列表[0…M-1]的槽位上。这样空间开销就从|U|缩减到了M.
但是这样会带来问题,就是碰撞(collision),因为是多对少的映射,碰撞不可避免。

解决碰撞的方法之一是链接法(chaining):把散列到同一槽中的所有元素都放在一个链表中。如下图:

3散列表的性能分析
若给定一个能存放n个元素的,具有m个槽位的散列表T.若用链接法,最坏的情况效果会很差,所有元素都被映射到一个槽里面。所以我们要求映射函数h,要将所有的关键字均匀分布在m个槽位上。
假设,任何元素散列到m个槽中的每个槽是等可能性,且相互独立的。称这个假设为简单一致散列(simple uniform hashing).
在上面的假设下,且n=O(m).在散列表中所有操作的期望时间为O(1).
4散列函数的选择
好的散列函数应尽可能满足,简单一致散列的假设。
4.1除法散列法
通过取k除以m的余数,将关键字映射到m个槽中去,即
h(k)=k mod m
m不应该是是2的整数次幂。若m=2^p,则h(k)就是k的p个最低位数字,我们不清楚关键字的p最低位是否均匀,所以m应该尽量选择不太接近2的整数幂的质数。
4.2乘法散列法
用关键字k乘以常数A,并且抽出kA的小数部分,然后用m乘以这个值,再取底floor.即:
h(k)=floor( m( k*A mod 1) )
乘法散列,m没有太多限制,一般取2的整数次幂,A一般取,(sqrt(5)-1)/2.
4.3全域散列(universal hashing):
随机的选择散列函数,使之独立于要存储的关键字,这种方法称为全域散列。这样无论关键字怎么选,其平均性能都很好(思想类似于随机快速排序,为了避免最坏的情况,让最后一个数字与前面的随机交换)。
5开放寻址法(open addressing)
未完待续
散列表 (Hash table,也叫哈希表)的更多相关文章
- 散列表(has table、哈希表)
一. 散列表是什么 是包含映射关系的一种数据结构,可以提高查找效率. 二. 散列函数 1)必须是一致的.假设输入一个单词“banana”,映射的数字是1,那么以后每次输入banana都要映射到数字1, ...
- Java 集合 散列表hash table
Java 集合 散列表hash table @author ixenos 摘要:hash table用链表数组实现.解决散列表的冲突:开放地址法 和 链地址法(冲突链表方式) hash table 是 ...
- 散列表(Hash Table)
散列表(hash table): 也称为哈希表. 根据wikipedia的定义:是根据关键字(Key value)而直接访问在内存存储位置的数据结构.也就是说,它通过把键值通过一个函数的计算,映射到表 ...
- 散列表(Hash table)及其构造
散列表(Hash table) 散列表,是根据关键码值(Key value)而直接进行访问的数据结构.它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.这个映射函数叫做散列函数,存放记录 ...
- [转载] 散列表(Hash Table)从理论到实用(上)
转载自:白话算法(6) 散列表(Hash Table)从理论到实用(上) 处理实际问题的一般数学方法是,首先提炼出问题的本质元素,然后把它看作一个比现实无限宽广的可能性系统,这个系统中的实质关系可以通 ...
- [转载] 散列表(Hash Table)从理论到实用(中)
转载自:白话算法(6) 散列表(Hash Table)从理论到实用(中) 不用链接法,还有别的方法能处理碰撞吗?扪心自问,我不敢问这个问题.链接法如此的自然.直接,以至于我不敢相信还有别的(甚至是更好 ...
- [转载] 散列表(Hash Table) 从理论到实用(下)
转载自: 白话算法(6) 散列表(Hash Table) 从理论到实用(下) [澈丹,我想要个钻戒.][小北,等等吧,等我再修行两年,你把我烧了,舍利子比钻戒值钱.] ——自扯自蛋 无论开发一个程序还 ...
- 算法导论-散列表(Hash Table)-大量数据快速查找算法
目录 引言 直接寻址 散列寻址 散列函数 除法散列 乘法散列 全域散列 完全散列 碰撞处理方法 链表法 开放寻址法 线性探查 二次探查 双重散列 随机散列 再散列问题 完整源码(C++) 参考资料 内 ...
- 散列表(hash table)——算法导论(13)
1. 引言 许多应用都需要动态集合结构,它至少需要支持Insert,search和delete字典操作.散列表(hash table)是实现字典操作的一种有效的数据结构. 2. 直接寻址表 在介绍散列 ...
- 建立简单的Hash table(哈希表)by C language
#define SIZE 1000 //定义Hash table的初始大小 struct HashArray { int key; int count; struct HashArray* next; ...
随机推荐
- Poj OpenJudge 百练 1573 Robot Motion
1.Link: http://poj.org/problem?id=1573 http://bailian.openjudge.cn/practice/1573/ 2.Content: Robot M ...
- 《RedHatLinux逻辑卷的管理》——一条龙服务
首先建2分区 [root@localhost ~]# partx -d /dev/sdb error deleting partition 4: BLKPG: No such device or ad ...
- 一款兼容pc 移动端的tab切换
利用touchslider.js插件来制作的tab切换,可任意修改很方便~~~ 样式: <style> .box-163css{ width:100%; position:relative ...
- php 生成器 入门理解
概念太晦涩,看不懂,直接上例子: 问题:得到一个1-1000000的整数数组,然后用foreach遍历输出 如果没有生成器,这样做: $arr=range(1,1000000);//这个函数最终会返回 ...
- python装饰器总结
一.装饰器是什么 python的装饰器本质上是一个Python函数,它可以让其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值也是一个函数对象.简单的说装饰器就是一个用来返回函数的函数 ...
- flash memory
数据删除不是以单个的字节为单位而是以固定的区块为单位(注意:NOR Flash 为字节存储.),区块大小一般为256KB到20MB. 由于其断电时仍能保存数据,闪存通常被用来保存设置信息,如在电脑的B ...
- Xubuntu下Mentohust认证(校园网用户)
对于路由器上网到用户来说,自动分配IP上网。 对于校园网用户,首先下载mentohust_0.3.4-1_i386.deb,双击安装程序 然后在命令窗口中输入sudo -s 密码:user来获得roo ...
- mysql常用数据类型的选择
时间戳可以用int来存储 ip地址的存储数据类型,可以使用INET_ATON 和INET_NTOA来配合bigint类型来代替varchar
- [译] ASP.NET 生命周期 – ASP.NET 请求生命周期(二)
ASP.NET 请求生命周期 全局应用类也可以用来跟踪每个独立请求的生命周期,包括请求从 ASP.NET 平台传递到 MVC 框架.ASP.NET 框架会创建一个定义在 Global.asax 文件中 ...
- vim中编写python代码使用python-mode和syntastic插件时警告(Warning)的消除
问题: 在Vim使用了syntastic后,编写代码时,可以对代码错误和警告进行相对实时的了解,对编写代码有很大的帮助.同时这个插件和python-mode一起工作时,可以对python代码的编写提供 ...