Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现
分离链接法 / Separate Chain Hashing
前面完成了一个基本散列表的实现,但是还存在一个问题,当散列表插入元素冲突时,散列表将返回异常,这一问题的解决方式之一为使用链表进行元素的存储,即分离链接法。
Separate Chain Hashing:
[0] Header->11->0->110
[1] Header->12->1->111
[2] Header->2->112
[3] Header->14->3->113
[4] Header->15->4->114
[5] Header->16->5
[6] Header->17->6
[7] Header->18->7
[8] Header->19->8
[9] Header->9
[10] Header->10
而在利用链表实现分离链接法时,可选用带表头的链表,插入元素时采用前端插入,每次将新元素插入对应散列位置链表的最前端,因为新插入的元素往往被查找的概率较大,放在前面便于缩短查找时间。
下面利用代码实现散列表的分离链接法,
完整代码
from hash_table import HashTable, kmt_hashing
from linked_list.linked_list_dummy_header import LinkedListDummyHeader as List class SeparateChainHashing(HashTable):
"""
Separate Chain Hashing:
[0] Header->11->0->110
[1] Header->12->1->111
[2] Header->2->112
[3] Header->14->3->113
[4] Header->15->4->114
[5] Header->16->5
[6] Header->17->6
[7] Header->18->7
[8] Header->19->8
[9] Header->9
[10] Header->10
"""
def __init__(self, size, fn):
self._array = [List() for i in range(size)]
self._hashing = fn def find(self, item):
linked_list = self._array[self._hashing(item)]
node = linked_list.header.next
while node and node.value != item:
node = node.next
return node def _insert(self, item):
"""
item
|
V
[n] Header->node_1->node_2->node_3
"""
if item is None:
return
linked_list = self._array[self._hashing(item)]
node = linked_list.header
while node.next:
if node.next.value == item: # Element existed
return
node = node.next
linked_list.insert(item, 1) def delete(self, item):
linked_list = self._array[self._hashing(item)]
linked_list.delete(item) def show(self):
print(self) @property
def load_factor(self):
element_num = sum(x.length-1 for x in self._array)
return element_num/self.size def make_empty(self):
# self._array = [List() for i in range(len(self._array))]
for chain in self._array:
chain.clear() def test(h):
print('\nShow hash table:')
h.insert(110, 111, 112, 113, 114)
h.insert(range(20))
h.delete(13)
h.show()
print('\nLoad factor is:', h.load_factor)
print('\nClear hash table:')
h.make_empty()
h.show() if __name__ == '__main__':
test(SeparateChainHashing(11, kmt_hashing(11)))
分段解释
首先导入散列表和散列函数,以及需要用到的带表头链表,
from hash_table import HashTable, kmt_hashing
from linked_list.linked_list_dummy_header import LinkedListDummyHeader as List
接着基于散列表派生一个实现分离链接法的散列表类,
class SeparateChainHashing(HashTable):
"""
Separate Chain Hashing:
[0] Header->11->0->110
[1] Header->12->1->111
[2] Header->2->112
[3] Header->14->3->113
[4] Header->15->4->114
[5] Header->16->5
[6] Header->17->6
[7] Header->18->7
[8] Header->19->8
[9] Header->9
[10] Header->10
"""
def __init__(self, size, fn):
self._array = [List() for i in range(size)]
self._hashing = fn
重载find方法,在查找到散列值对应的链表后,遍历链表查询目标值,
def find(self, item):
linked_list = self._array[self._hashing(item)]
node = linked_list.header.next
while node and node.value != item:
node = node.next
return node
重载_insert方法,插入元素时,向链表表头后的第一个位置进行插入,
def _insert(self, item):
"""
item
|
V
[n] Header->node_1->node_2->node_3
"""
if item is None:
return
linked_list = self._array[self._hashing(item)]
node = linked_list.header
while node.next:
if node.next.value == item: # Element existed
return
node = node.next
linked_list.insert(item, 1)
重载delete方法,删除元素较为简单,查找到散列值对应的链表后,使用链表的删除函数即可,
def delete(self, item):
linked_list = self._array[self._hashing(item)]
linked_list.delete(item)
最后,分别完成显示散列表,计算装填因子和清空散列表的函数,
def show(self):
print(self) @property
def load_factor(self):
element_num = sum(x.length-1 for x in self._array)
return element_num/self.size def make_empty(self):
# self._array = [List() for i in range(len(self._array))]
for chain in self._array:
chain.clear()
完成散列表类后,再写一个测试函数,用于测试散列表,以 11 为散列表大小初始化一个散列表进行测试
def test(h):
print('\nShow hash table:')
h.insert(110, 111, 112, 113, 114)
h.insert(range(20))
h.delete(13)
h.show()
print('\nLoad factor is:', h.load_factor)
print('\nClear hash table:')
h.make_empty()
h.show() if __name__ == '__main__':
test(SeparateChainHashing(11, kmt_hashing(11)))
最后得到结果
Show hash table:
[0] Header->11->0->110
[1] Header->12->1->111
[2] Header->2->112
[3] Header->14->3->113
[4] Header->15->4->114
[5] Header->16->5
[6] Header->17->6
[7] Header->18->7
[8] Header->19->8
[9] Header->9
[10] Header->10 Load factor is: 2.1818181818181817 Clear hash table:
[0] Header
[1] Header
[2] Header
[3] Header
[4] Header
[5] Header
[6] Header
[7] Header
[8] Header
[9] Header
[10] Header
可以看到,由于链表的存在,冲突被很好的解决了。而另一种冲突解决方式,可参考相关阅读中的开放定址法。
相关阅读
1. 散列表
2. 开放定址法
Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现的更多相关文章
- Python与数据结构[4] -> 散列表[2] -> 开放定址法与再散列的 Python 实现
开放定址散列法和再散列 目录 开放定址法 再散列 代码实现 1 开放定址散列法 前面利用分离链接法解决了散列表插入冲突的问题,而除了分离链接法外,还可以使用开放定址法来解决散列表的冲突问题. 开放定 ...
- Python与数据结构[4] -> 散列表[0] -> 散列表与散列函数的 Python 实现
散列表 / Hash Table 散列表与散列函数 散列表是一种将关键字映射到特定数组位置的一种数据结构,而将关键字映射到0至TableSize-1过程的函数,即为散列函数. Hash Table: ...
- Nginx数据结构之散列表
1. 散列表(即哈希表概念) 散列表是根据元素的关键码值而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录, 以加快查找速度.这个映射函数 f 叫做散列方法,存放记录的数 ...
- JAVA数据结构--哈希表的实现(分离链接法)
哈希表(散列)的定义 散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度 ...
- 解决hash冲突之分离链接法
解决hash冲突之分离链接法 分离链接法:其做法就是将散列到同一个值的所有元素保存到一个表中. 这样讲可能比较抽象,下面看一个图就会很清楚,图如下 相应的实现可以用分离链接散列表来实现(其实就是一个l ...
- 分离链接法(Separate Chaining)
之前我们说过,对于需要动态维护的散列表 冲突是不可避免的,无论你的散列函数设计的有多么精妙.因此我们解决的重要问题就是:一旦发生冲突,我们该如何加以排解? 我们在这里讨论最常见的两种方法:分离链接法和 ...
- POJ2549【hash分离链接法】
题意: 给n个不同的数,求一个4个数(a,b,c,d)的组合满足a+b+c=d;求最大的d. 思路: 没想到可以用hash搞/ 这个就是数据结构里的分离链接法~ 解决hash冲突的方法:将所有关键字为 ...
- jdk1.8HashMap底层数据结构:散列表+链表+红黑树,jdk1.8HashMap数据结构图解+源码说明
一.前言 本文由jdk1.8源码整理而得,附自制jdk1.8底层数据结构图,并截取部分源码加以说明结构关系. 二.jdk1.8 HashMap底层数据结构图 三.源码 1.散列表(Hash table ...
- JS中数据结构之散列表
散列是一种常用的数据存储技术,散列后的数据可以快速地插入或取用.散列使用的数据 结构叫做散列表.在散列表上插入.删除和取用数据都非常快. 下面的散列表是基于数组进行设计的,数组的长度是预先设定的,如有 ...
随机推荐
- WebSocket添加事件监听器(6)
WebSocket编程遵循异步编程模型;打开socket后,只需要等待事件发生,而不需要主动向服务器轮询,所以需要在WebSocket对象中添加回调函数来监听事件. WebSocket对象有三个事件: ...
- cdh版本的hadoop安装及配置(伪分布式模式) MapReduce配置 yarn配置
安装hadoop需要jdk依赖,我这里是用jdk8 jdk版本:jdk1.8.0_151 hadoop版本:hadoop-2.5.0-cdh5.3.6 hadoop下载地址:链接:https://pa ...
- BZOJ1095 [ZJOI2007]Hide 捉迷藏 【动态点分治 + 堆】
题目链接 BZOJ1095 题解 传说中的动态点分治,一直不敢碰 今日一会,感觉其实并不艰涩难懂 考虑没有修改,如果不用树形dp的话,就得点分治 对于每个重心,我们会考虑其分治的子树内所有点到它的距离 ...
- 【ZJ选讲·压缩】
给一个由小写字母组成的字符串(len<=50) 我们可以用一种简单的方法来压缩其中的重复信息. 用M,R两个大写字母表示压缩信息 M标记重复串的开始, R表示后面的一段字符串重复从上一个 ...
- Website Collection
前一百个卡特兰数 Candy?的博弈论总结 杜教筛资料 线性基资料 (ex)BSGS资料 斐波那契数列前300项 斯特林数 STL标准库-容器-unordered_set C++ unordered_ ...
- 在Eclipse上使用egit插件通过ssh协议方式上传项目代码的具体步骤
在Eclipse上使用egit插件通过ssh协议方式上传项目代码 前戏: 使用ssh方式可以不通过https协议,避免直接提供账号密码的方式上传项目到git在线服务器,如Bitbucket.GitHu ...
- 判断当前系统当前浏览器是否安装启用 Adobe Flash Player,检查在chrome中的状态
一.判断当前所在系统 let sUserAgent = navigator.userAgent;let isWin = (navigator.platform == "Win32" ...
- HDU 1394 Minimum Inversion Number(树状数组/归并排序实现
Minimum Inversion Number Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java ...
- 修改centos的源
最近都在使用国内的VPS.系统统一使用的都是Linux系统.但是,有一些服务商的系统给默认设置的是国外的.这样就会导致下载速度缓慢.于是,找到了国内几家比较热门的镜像点.奉献给大家.下面的镜像全部支持 ...
- intellij IDEA与springboot项目建立
概念问题: IntelliJ系中的Project相当于Eclipse系中的workspace.IntelliJ系中的Module相当于Eclipse系中的Project.IntelliJ中一个Proj ...