Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现

分离链接法 / Separate Chain Hashing

前面完成了一个基本散列表的实现，但是还存在一个问题，当散列表插入元素冲突时，散列表将返回异常，这一问题的解决方式之一为使用链表进行元素的存储，即分离链接法。

Separate Chain Hashing:

        [0]  Header->11->0->110

        [1]  Header->12->1->111

        [2]  Header->2->112

        [3]  Header->14->3->113

        [4]  Header->15->4->114

        [5]  Header->16->5

        [6]  Header->17->6

        [7]  Header->18->7

        [8]  Header->19->8

        [9]  Header->9

        [10] Header->10

而在利用链表实现分离链接法时，可选用带表头的链表，插入元素时采用前端插入，每次将新元素插入对应散列位置链表的最前端，因为新插入的元素往往被查找的概率较大，放在前面便于缩短查找时间。

下面利用代码实现散列表的分离链接法，

完整代码

 from hash_table import HashTable, kmt_hashing

 from linked_list.linked_list_dummy_header import LinkedListDummyHeader as List

 class SeparateChainHashing(HashTable):

     """

     Separate Chain Hashing:

         [0]  Header->11->0->110

         [1]  Header->12->1->111

         [2]  Header->2->112

         [3]  Header->14->3->113

         [4]  Header->15->4->114

         [5]  Header->16->5

         [6]  Header->17->6

         [7]  Header->18->7

         [8]  Header->19->8

         [9]  Header->9

         [10] Header->10

     """

     def __init__(self, size, fn):

         self._array = [List() for i in range(size)]

         self._hashing = fn

     def find(self, item):

         linked_list = self._array[self._hashing(item)]

         node = linked_list.header.next

         while node and node.value != item:

             node = node.next

         return node

     def _insert(self, item):

         """

                    item

                     |

                     V

         [n]  Header->node_1->node_2->node_3

         """

         if item is None:

             return

         linked_list = self._array[self._hashing(item)]

         node = linked_list.header

         while node.next:

             if node.next.value == item:  # Element existed

                 return

             node = node.next

         linked_list.insert(item, 1)

     def delete(self, item):

         linked_list = self._array[self._hashing(item)]

         linked_list.delete(item)

     def show(self):

         print(self)

     @property

     def load_factor(self):

         element_num = sum(x.length-1 for x in self._array)

         return element_num/self.size

     def make_empty(self):

         # self._array = [List() for i in range(len(self._array))]

         for chain in self._array:

             chain.clear()

 def test(h):

     print('\nShow hash table:')

     h.insert(110, 111, 112, 113, 114)

     h.insert(range(20))

     h.delete(13)

     h.show()

     print('\nLoad factor is:', h.load_factor)

     print('\nClear hash table:')

     h.make_empty()

     h.show()

 if __name__ == '__main__':

     test(SeparateChainHashing(11, kmt_hashing(11)))

分段解释

首先导入散列表和散列函数，以及需要用到的带表头链表，

 from hash_table import HashTable, kmt_hashing

 from linked_list.linked_list_dummy_header import LinkedListDummyHeader as List

接着基于散列表派生一个实现分离链接法的散列表类，

 class SeparateChainHashing(HashTable):

     """

     Separate Chain Hashing:

         [0]  Header->11->0->110

         [1]  Header->12->1->111

         [2]  Header->2->112

         [3]  Header->14->3->113

         [4]  Header->15->4->114

         [5]  Header->16->5

         [6]  Header->17->6

         [7]  Header->18->7

         [8]  Header->19->8

         [9]  Header->9

         [10] Header->10

     """

     def __init__(self, size, fn):

         self._array = [List() for i in range(size)]

         self._hashing = fn

重载find方法，在查找到散列值对应的链表后，遍历链表查询目标值，

     def find(self, item):

         linked_list = self._array[self._hashing(item)]

         node = linked_list.header.next

         while node and node.value != item:

             node = node.next

         return node

重载_insert方法，插入元素时，向链表表头后的第一个位置进行插入，

     def _insert(self, item):

         """

                    item

                     |

                     V

         [n]  Header->node_1->node_2->node_3

         """

         if item is None:

             return

         linked_list = self._array[self._hashing(item)]

         node = linked_list.header

         while node.next:

             if node.next.value == item:  # Element existed

                 return

             node = node.next

         linked_list.insert(item, 1)

重载delete方法，删除元素较为简单，查找到散列值对应的链表后，使用链表的删除函数即可，

     def delete(self, item):

         linked_list = self._array[self._hashing(item)]

         linked_list.delete(item)

最后，分别完成显示散列表，计算装填因子和清空散列表的函数，

     def show(self):

         print(self)

     @property

     def load_factor(self):

         element_num = sum(x.length-1 for x in self._array)

         return element_num/self.size

     def make_empty(self):

         # self._array = [List() for i in range(len(self._array))]

         for chain in self._array:

             chain.clear()

完成散列表类后，再写一个测试函数，用于测试散列表，以 11 为散列表大小初始化一个散列表进行测试

 def test(h):

     print('\nShow hash table:')

     h.insert(110, 111, 112, 113, 114)

     h.insert(range(20))

     h.delete(13)

     h.show()

     print('\nLoad factor is:', h.load_factor)

     print('\nClear hash table:')

     h.make_empty()

     h.show()

 if __name__ == '__main__':

     test(SeparateChainHashing(11, kmt_hashing(11)))

最后得到结果

Show hash table:

[0] Header->11->0->110

[1] Header->12->1->111

[2] Header->2->112

[3] Header->14->3->113

[4] Header->15->4->114

[5] Header->16->5

[6] Header->17->6

[7] Header->18->7

[8] Header->19->8

[9] Header->9

[10] Header->10

Load factor is: 2.1818181818181817

Clear hash table:

[0] Header

[1] Header

[2] Header

[3] Header

[4] Header

[5] Header

[6] Header

[7] Header

[8] Header

[9] Header

[10] Header

可以看到，由于链表的存在，冲突被很好的解决了。而另一种冲突解决方式，可参考相关阅读中的开放定址法。

相关阅读

1. 散列表

2. 开放定址法

Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现的更多相关文章

Python与数据结构[4] -> 散列表[2] -> 开放定址法与再散列的 Python 实现
开放定址散列法和再散列目录开放定址法再散列代码实现 1 开放定址散列法前面利用分离链接法解决了散列表插入冲突的问题,而除了分离链接法外,还可以使用开放定址法来解决散列表的冲突问题. 开放定 ...
Python与数据结构[4] -> 散列表[0] -> 散列表与散列函数的 Python 实现
散列表 / Hash Table 散列表与散列函数散列表是一种将关键字映射到特定数组位置的一种数据结构,而将关键字映射到0至TableSize-1过程的函数,即为散列函数. Hash Table: ...
Nginx数据结构之散列表
1. 散列表(即哈希表概念) 散列表是根据元素的关键码值而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录, 以加快查找速度.这个映射函数 f 叫做散列方法,存放记录的数 ...
JAVA数据结构--哈希表的实现（分离链接法）
哈希表(散列)的定义散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度 ...
解决hash冲突之分离链接法
解决hash冲突之分离链接法分离链接法:其做法就是将散列到同一个值的所有元素保存到一个表中. 这样讲可能比较抽象,下面看一个图就会很清楚,图如下相应的实现可以用分离链接散列表来实现(其实就是一个l ...
分离链接法(Separate Chaining)
之前我们说过,对于需要动态维护的散列表冲突是不可避免的,无论你的散列函数设计的有多么精妙.因此我们解决的重要问题就是:一旦发生冲突,我们该如何加以排解? 我们在这里讨论最常见的两种方法:分离链接法和 ...
POJ2549【hash分离链接法】
题意: 给n个不同的数,求一个4个数(a,b,c,d)的组合满足a+b+c=d;求最大的d. 思路: 没想到可以用hash搞/ 这个就是数据结构里的分离链接法~ 解决hash冲突的方法:将所有关键字为 ...
jdk1.8HashMap底层数据结构：散列表+链表+红黑树，jdk1.8HashMap数据结构图解+源码说明
一.前言本文由jdk1.8源码整理而得,附自制jdk1.8底层数据结构图,并截取部分源码加以说明结构关系. 二.jdk1.8 HashMap底层数据结构图三.源码 1.散列表(Hash table ...
JS中数据结构之散列表
散列是一种常用的数据存储技术,散列后的数据可以快速地插入或取用.散列使用的数据结构叫做散列表.在散列表上插入.删除和取用数据都非常快. 下面的散列表是基于数组进行设计的,数组的长度是预先设定的,如有 ...

随机推荐

[洛谷P2590][ZJOI2008]树的统计
题目大意:一棵树,支持三个操作, $CHANGE\;u\;t:$ 把结点$u$的权值改为$t$ $QMAX\;u\;v:$ 询问从点$u$到点$v$的路径上的节点的最大权值 $QSUM\;u\;v:$ ...
Expect使用小记
By francis_hao May 31,2017 本文翻译了部分Expect的man手册,只选取了个人常用的功能,因此并不完善. Expect是一个可以和交互式程序对话的程序概述 ...
eclipse中的debug按钮组突然找不到了，找回方法
ansible 批量修改root密码
[root@sz_fy_virt_encrypt_33_239 fetch]# cat /opt/passwd.yml - hosts: web vars: path: /home/opsadmin ...
使用mysqldump命令备份恢复MySQL数据库
1.各种用法说明 A. 最简单的用法: mysqldump -uroot -pPassword [database name] > [dump file] 上述命令将指定数据库备份到某dump文 ...
Idea 部署非Maven项目
参考:http://m.blog.csdn.net/z69183787/article/details/78030857 以前一直很好奇,在idea中运行tomcat,把项目部署到其中,运行起来,然后 ...
COGS2642 / Bzoj4590 [Shoi2015]自动刷题机
Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 906 Solved: 321 Description 曾经发明了信号增幅仪的发明家SHTSC又公开了 ...
jupyter、flask、tornado、djiango安装
安装了pip包的话直接使用: 1.安装jupyter:pip install jupyter 2.安装flask: pip install flask 3.安装tornado:pip install ...
autoKeras Windows 的入门测试
在测试中分析一下ide的效果,在pycharm中测试的时候老师提示内存溢出,而且跑autoKeras的cnn时确实消耗很大空间.但是同样的电脑,换了vscode进行测试的时候没有问题.我也不知道什么回 ...
mysql五-2:多表查询
一介绍本节主题多表连接查询复合条件连接查询子查询准备表 company.employeecompany.department #建表 create table department( id ...

Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现

Python与数据结构[4] -> 散列表[1] -> 分离链接法的 Python 实现的更多相关文章

随机推荐

热门专题