哈希表(Hash Table)

二分搜索中提到了在有序集合中查询某个特定元素的时候,通过折半的方式进行搜索是一种很高效的算法。那能否根据特征直接定位元素,而非折半去查找?哈希表(Hash Table),也称为散列表,就是一种数据结构,用于实现键-值对的映射关系。它通过将键映射到特定的值(哈希值)来实现快速的数据检索。

	// Java 中Hash表JDK中有提供两种结构Hashtable、HashMap,使用接口上区别不大
// Hashtable 是Dictionary类的子类,而 HashMap 是AbstractMap类的子类。
// 由于 Dictionary类已经被废弃,因此Hashtable也不再推荐使用。
// 在工程应用上值得注意的是 Hashtable是线程安全的,而HashMap不是 public HashMap<Integer,Long> records1 = new HashMap<>();
public Hashtable<Integer,Long> records2 = new Hashtable<>();

一般而言,哈希表基于哈希函数将键转换为哈希码,然后使用这个哈希码作为索引获取相应的元素。哈希表的优点是具有快速的平均查找时间,通常为O(1)。然而,它也具有一些挑战,如处理哈希冲突、设计良好的哈希函数和维护适当的装载因子。装载因子表示哈希表已用空间与总空间的比例,需要适时进行动态调整以保持哈希表的性能。

	// 示例java中初始化 HashMap的容量以及装载因子。
Map<Integer,Integer> sumMap = new HashMap<>(2000,0.75f);

哈希表在计算机科学中有广泛的应用,包括实现关联数组、数据库索引、缓存、编程语言中的字典和集合等等。

基本概念

哈希函数(Hash Function): 哈希表使用哈希函数来将键转换为整数,通常是数组的索引。哈希函数应该是确定性的,即对于相同的键,它应该生成相同的哈希码。理想情况下,不同的键应该映射到不同的哈希码,但由于哈希函数的有限性,可能会出现哈希冲突。

哈希冲突(Hash Collision): 当两个不同的键映射到相同的哈希码时,发生哈希冲突。哈希表需要处理哈希冲突,以确保不同的键可以正确存储和检索。

存储结构: 哈希表通常由一个数组和一个哈希函数组成。数组的每个元素称为桶(Bucket),它可以存储一个或多个键-值对。

PS:Java 中由于都已经封装好了 HashMap,一般使用可能感知不到这些概念,但要熟练掌握还是需要理解这些基本理念。

基本操作

插入(Insertion): 将键-值对插入哈希表时,首先通过哈希函数计算键的哈希码,然后确定存储位置(桶)。如果存在哈希冲突,通常会使用链表、数组或其他数据结构来解决冲突,并将键-值对添加到存储位置。

查找(Lookup): 查找键对应的值时,使用相同的哈希函数计算哈希码,并在存储位置中查找该键。如果存在哈希冲突,必须在冲突的元素中搜索以找到正确的键-值对。

删除(Deletion): 删除键-值对时,使用相同的哈希函数计算哈希码,然后从存储位置中删除对应的键-值对。

基本应用

Leetcode 383 赎金信【简单】

给你两个字符串:ransomNote 和 magazine ,判断 ransomNote 能不能由 magazine 里面的字符构成。

如果可以,返回 true ;否则返回 false 。

字符可以转换成ASCII数字,数组的下标也是数字。那么利用这种数字映射作为哈希函数,就能够通过字符直接读取数组存储的信息。通过ASCII数组 来记录 magazine 里面包含的各个字符数量,再遍历 ransomNote 使用到的字符判断是否存在于 ASCII数组,并减少数量来标识已经使用过。

借这题不妨讲一讲分块的编码风格。在日常生活中,我们一定有记忆手机号码的经历,一个长长的数字串(比如1234567890)可能很难记忆,但如果将其分成更小的组块,例如(123) 456-7890,就更容易记忆和处理。这个其实在认识心理学里面概念叫:"信息分块"(chunking),_指的是将大量的信息分割成更小的、有意义的单元,以便更容易处理和记忆。_关键点是人类大脑通过将信息分成较小的组块,可以更有效地处理和记忆信息。

所谓代码可读性其实就是对代码的认识,将信息认识心理学的分块理论应用到代码可读性就是提倡的 分块编码。可以将冗余的代码分成一块一块的逻辑,块与块之间用空行来进行视觉上的分块,方便小段小段的去理解代码逻辑;每一块代码可以适当的加上注释以方便阅读。当然这些都是形式上的,更重要的是每一块代码逻辑都会聚焦一个目标,这样写法也有利于编码者自身对逻辑的梳理以及减少bug。

不妨练习下类似问题,参考代码就不附上了,相信一定能够完成。

Leetcode 242. 有效的字母异位词【简单】

给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。

注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。

更多应用

Leetcode 560. 和为 K 的子数组【中等】

给你一个整数数组 nums 和一个整数 k ,请你统计并返回 该数组中和为 k 的子数组的个数 。

子数组是数组中元素的连续非空序列。

Leetcode 3 无重复字符的最长子串【中等】

给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。

数据结构与算法 | 哈希表(Hash Table)的更多相关文章

  1. 算法与数据结构基础 - 哈希表(Hash Table)

    Hash Table基础 哈希表(Hash Table)是常用的数据结构,其运用哈希函数(hash function)实现映射,内部使用开放定址.拉链法等方式解决哈希冲突,使得读写时间复杂度平均为O( ...

  2. 数据结构 哈希表(Hash Table)_哈希概述

    哈希表支持一种最有效的检索方法:散列. 从根来上说,一个哈希表包含一个数组,通过特殊的索引值(键)来访问数组中的元素. 哈希表的主要思想是通过一个哈希函数,在所有可能的键与槽位之间建立一张映射表.哈希 ...

  3. PHP关联数组和哈希表(hash table) 未指定

    PHP有数据的一个非常重要的一类,就是关联数组.又称为哈希表(hash table),是一种很好用的数据结构. 在程序中.我们可能会遇到须要消重的问题,举一个最简单的模型: 有一份username列表 ...

  4. python数据结构与算法——哈希表

    哈希表 学习笔记 参考翻译自:<复杂性思考> 及对应的online版本:http://greenteapress.com/complexity/html/thinkcomplexity00 ...

  5. Java数据结构和算法 - 哈希表

    Q: 如何快速地存取员工的信息? A: 假设现在要写一个程序,存取一个公司的员工记录,这个小公司大约有1000个员工,每个员工记录需要1024个字节的存储空间,因此整个数据库的大小约为1MB.一般的计 ...

  6. 什么叫哈希表(Hash Table)

    散列表(也叫哈希表),是根据关键码值直接进行访问的数据结构,也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.这个映射函数叫做散列函数,存放记录的数组叫做散列表. - 数据结构 ...

  7. 词典(二) 哈希表(Hash table)

    散列表(hashtable)是一种高效的词典结构,可以在期望的常数时间内实现对词典的所有接口的操作.散列完全摒弃了关键码有序的条件,所以可以突破CBA式算法的复杂度界限. 散列表 逻辑上,有一系列可以 ...

  8. golang数据结构之散哈希表(Hash)

    hash.go package hash import ( "fmt" ) type Emp struct { ID int Name string Next *Emp } //第 ...

  9. 哈希表(Hash table)

  10. Redis原理再学习04:数据结构-哈希表hash表(dict字典)

    哈希函数简介 哈希函数(hash function),又叫散列函数,哈希算法.散列函数把数据"压缩"成摘要,有的也叫"指纹",它使数据量变小且数据格式大小也固定 ...

随机推荐

  1. Redis的五大数据类型及其使用场景

    前言 redis是一个非常快速‎‎的非关系数据库‎‎解决方案.其简单的键值数据模型使 Redis 能够处理大型数据集,同时保持令人印象深刻的读写速度和可用性.‎redis提供了五种数据类型,分别是是: ...

  2. docker笔记-安装、操作和Registry

    注意事项 强烈建议docker宿主机关闭firewalld,改用iptables 1 docker安装 1.1 离线安装 下载 Docker 二进制文件(https://download.docker ...

  3. Gin+Xterm.js实现远程Kubernetes Pod(一)

    Xterm.js简介 xterm.js (https://xtermjs.org/)是一个开源的 JavaScript 库,它模拟了一个终端接口,可以在网页中嵌入一个完全功能的终端.这个库非常灵活,并 ...

  4. [selenium]相对定位器

    前言 Relative Locators,相对定位器,是Selenium 4引入的一个新的定位器,相对定位器根据源点元素去定位相对位置的其它元素. 相对定位方法其实是基于JavaScript的 get ...

  5. phpexcel图片获取

    phpexcel图片获取常见的两种方式: require_once dirname(__FILE__) . '/../Jn/PHPExcel.php'; $filePath = "123.x ...

  6. Inno SetUp安装包:如何在程序安装时卸载驱动程序

    pnputil命令行方式卸载 如果您想通过命令行卸载.INF文件的驱动程序,您需要使用PnPUtil命令.以下是一个示例: pnputil /delete-driver oem0.inf /unins ...

  7. [Mysql] 存储过程简单理解

    什么是存储过程 简单的说, 就是一组SQL语句集, 功能强大, 可以实现一些比较复杂的逻辑功能. 其实就和编程语言的面向过程函数一样. ps: 存储过程与触发器类似, 但存储过程是主动调用, 触发器是 ...

  8. 【.NET8】访问私有成员新姿势UnsafeAccessor(上)

    前言 前几天在.NET性能优化群里面,有群友聊到了.NET8新增的一个特性,这个类叫UnsafeAccessor,有很多群友都不知道这个特性是干嘛的,所以我就想写一篇文章来带大家了解一下这个特性. 其 ...

  9. nodejs实现的一个简单粗暴的洗牌算法

    据说名字长别人不一定看得到 之前用python,自带shuffle用的还是超爽的: 去年6月份自己动手用nodejs写一个21点扑克游戏的后台时,就需要一个洗牌算法,于是简单粗暴的实现了一个. 贴出来 ...

  10. Solution -「THUPC 2019」Duckchess

    Description Link. 大模拟是不可能给你概括题意的. Solution (据说鸭棋题解用这个标题很吉利)(这里是被点名批评的 长度 19k 的打法)(先说好代码里 Chinglish 满 ...