【算法】哈希表的诞生(Java)
为什么要使用哈希表
哈希表的取舍
使用哈希表的前提
哈希函数的构造
1.直接定址法

2.数字分析法

3. 平方取中法

4.折叠法

5.除留余数法

哈希地址的冲突

解决冲突的方法
冲突并不是一件严重的事情,因为我们可以用一些方式去解决它
解决冲突的方式有三种: 拉链法,线性探测法和再哈希法
拉链法
拉链法是基于链表实现的查找表去实现的,关于链表查找表可以看下我之前写的这篇文章:


编写哈希函数
/**
* @description: 根据输入的键获取对应的哈希值
*/
private int hash (Key key) {
return (key.hashCode() & 0x7fffffff) % M;
}
- SeparateChainingHashST.java: 拉链法实现的哈希表
- SequentialSearchST.java: 链表查找表
- Test.java: 测试代码
public class SeparateChainingHashST<Key,Value> {
private int M; // 数组的大小
private SequentialSearchST<Key, Value> [] st; // 链表查找表对象组成的数组
public SeparateChainingHashST (int M) {
st= new SequentialSearchST [M];
this.M = M;
// 初始化数组st中的链表对象
for (int i=0;i<st.length;i++) {
st[i] = new SequentialSearchST();
}
}
/**
* @description: 根据输入的键获取对应的哈希值
*/
private int hash (Key key) {
return (key.hashCode() & 0x7fffffff) % M;
}
/**
* @description: 根据给定键获取值
*/
public Value get (Key key) {
return st[hash(key)].get(key);
}
/**
* @description: 向表中插入键值对
*/
public void put (Key key, Value val) {
st[hash(key)].put(key, val);
}
/**
* @description: 根据给定键删除键值对
*/
public void delete (Key key) {
st[hash(key)].delete(key);
}
}
public class SequentialSearchST<Key, Value> {
Node first; // 头节点
int N = 0; // 链表长度
private class Node {
Key key;
Value value;
Node next; // 指向下一个节点
public Node (Key key,Value value,Node next) {
this.key = key;
this.value = value;
this.next = next;
}
}
public int size () {
return N;
}
public void put (Key key, Value value) {
for(Node n=first;n!=null;n=n.next) { // 遍历链表节点
if(n.key == key) { // 查找到给定的key,则更新相应的value
n.value = value;
return;
}
}
// 遍历完所有的节点都没有查找到给定key
// 1. 创建新节点,并和原first节点建立“next”的联系,从而加入链表
// 2. 将first变量修改为新加入的节点
first = new Node(key,value,first);
N++; // 增加字典(链表)的长度
}
public Value get (Key key) {
for(Node n=first;n!=null;n=n.next) {
if(n.key.equals(key)) return n.value;
}
return null;
}
public void delete (Key key) {
if (N == 1) {
first = null;
return ;
}
for(Node n =first;n!=null;n=n.next) {
if(n.next.key.equals(key)) {
n.next = n.next.next;
N--;
return ;
}
}
}
}
public class Test {
public static void main (String args[]) {
SeparateChainingHashST<String, Integer> hashST = new SeparateChainingHashST<>(16);
hashST.put("A",1); // 插入键值对 A - 1
hashST.put("B",2); // 插入键值对 B - 2
hashST.delete("B"); // 删除键值对 B - 2
System.out.println(hashST.get("A")); // 输出 1
System.out.println(hashST.get("B")); // 输出 null
}
}
线性探测法
public class LinearProbingHashST<Key, Value> {
private int M; // 数组的大小
private int N; // 键值对对数
private Key [] keys;
private Value [] vals;
public LinearProbingHashST (int M) {
this.M = M;
keys = (Key []) new Object[M];
vals = (Value[]) new Object[M];
}
/**
* @description: 获取哈希值
*/
private int hash (Key key) {
return (key.hashCode() & 0x7fffffff) % M;
}
/**
* @description: 插入操作
*/
public void put (Key key, Value val) // 具体代码下文给出
/**
* @description: 根据给定键获取值
*/
public Value get (Key key) // 具体代码下文给出
/**
* @description: 删除操作
*/
public void delete (Key key) // 具体代码下文给出
}
- 插入操作是小偷藏进箱子的过程;
- 查找操作是警察寻找某个小偷的过程;
- 删除操作是小偷被警察抓获,同时离开箱子的过程
插入操作
- 该位置键为空,则插入键值对
- 该位置键不为空,但已有键和给定键相等,则更新对应的值
- 该位置键和给定键不同,则继续检查下一个键


/**
* @description: 调整数组大小
*/
private void resize (int max) {
Key [] temp = (Key [])new Object[max];
for (int i =0;i<keys.length;i++) {
temp[i] = keys[i];
}
keys = temp;
}
/**
* @description: 插入操作
*/
public void put (Key key, Value val) {
// 当键值对数量已经超过数组一半时,将数组长度扩大一倍
if(N>(M/2)) resize(2*M);
// 计算哈希值,求出键的位置
int i = hash(key);
// 判断该位置键是否为空
while(keys[i]!=null) {
if(key.equals(keys[i])) {
// 该位置的键和给定key相同,则更新对应的值
vals[i] = val;
return;
} else {
// 该位置的键和给定key不同,则检查下一个位置的键
i = (i+1) % M;
}
}
// 该位置键为空则插入键值对
keys[i] = key;
vals[i] = val;
N++;
return;
}



简单思考下就能明白为什么随着键值对占数组长度的比例的增加, 哈希表的性能会下降: 因为在这个过程中,将更容易形成长的键簇(一段连续的非空键的组合)。而哈希表的查找/插入等一般都是遇到空键才能结束, 因此,长键簇越多,查找/插入的时间就越长,哈希表的性能也就越差

查找操作


/**
* @description: 根据给定键获取值
*/
public Value get (Key key) {
for (int i=hash(key);keys[i]!=null;i=(i+1)%M) {
if (key.equals(keys[i])) {
return vals[i];
}
}
return null;
}
删除操作



/**
* @description: 删除操作
*/
public void delete (Key key) {
// 给定键不存在,不进行删除
if (get(key) == null) return ;
// 计算哈希值, 求得键的位置
int i = hash(key);
// 获取给定键的下标
while (!key.equals(keys[i])) {
i = (i+1) % M;
}
// 删除键值对
keys[i] = null;
vals[i] = null;
// 对被删除键后面键簇的所有键都进行删除并重新插入
i = (i+1)%M;
while (keys[i]!=null) {
Key redoKey = keys[i];
Value redoVal = vals[i];
keys[i] = null;
vals[i] = null;
put(redoKey,redoVal);
i = (1+1) % M;
}
N--;
}
public class LinearProbingHashST<Key, Value> {
private int M; // 数组的大小
private int N; // 键值对对数
private Key [] keys;
private Value [] vals;
public LinearProbingHashST (int M) {
this.M = M;
keys = (Key []) new Object[M];
vals = (Value[]) new Object[M];
}
/**
* @description: 获取哈希值
*/
private int hash (Key key) {
return (key.hashCode() & 0x7fffffff) % M;
}
/**
* @description: 调整数组大小
*/
private void resize (int max) {
Key [] temp = (Key [])new Object[max];
for (int i =0;i<keys.length;i++) {
temp[i] = keys[i];
}
keys = temp;
}
/**
* @description: 插入操作
*/
public void put (Key key, Value val) {
// 当键值对数量已经超过数组一半时,将数组长度扩大一倍
if(N>(M/2)) resize(2*M);
// 计算哈希值,求出键的位置
int i = hash(key);
// 判断该位置键是否为空
while(keys[i]!=null) {
if(key.equals(keys[i])) {
// 该位置的键和给定key相同,则更新对应的值
vals[i] = val;
return;
} else {
// 该位置的键和给定key不同,则检查下一个位置的键
i = (i+1) % M;
}
}
// 该位置键为空则插入键值对
keys[i] = key;
vals[i] = val;
N++;
return;
}
/**
* @description: 根据给定键获取值
*/
public Value get (Key key) {
for (int i=hash(key);keys[i]!=null;i=(i+1)%M) {
if (key.equals(keys[i])) {
return vals[i];
}
}
return null;
}
/**
* @description: 删除操作
*/
public void delete (Key key) {
// 给定键不存在,不进行删除
if (get(key) == null) return ;
// 计算哈希值, 求得键的位置
int i = hash(key);
// 获取给定键的下标
while (!key.equals(keys[i])) {
i = (i+1) % M;
}
// 删除键值对
keys[i] = null;
vals[i] = null;
// 对被删除键后面键簇的键的位置进行删除并重新插入
i = (i+1)%M;
while (keys[i]!=null) {
Key redoKey = keys[i];
Value redoVal = vals[i];
keys[i] = null;
vals[i] = null;
put(redoKey,redoVal);
i = (1+1) % M;
}
N--;
}
}
public class Test {
public static void main (String args[]) {
LinearProbingHashST<String, Integer> lst = new LinearProbingHashST<>(10);
lst.put("A",1);
lst.put("B",2);
lst.delete("A");
System.out.println(lst.get("A")); // 输出null
System.out.println(lst.get("B")); // 输出 2
}
}
再哈希法

【算法】哈希表的诞生(Java)的更多相关文章
- 数据结构和算法(Golang实现)(26)查找算法-哈希表
哈希表:散列查找 一.线性查找 我们要通过一个键key来查找相应的值value.有一种最简单的方式,就是将键值对存放在链表里,然后遍历链表来查找是否存在key,存在则更新键对应的值,不存在则将键值对链 ...
- Java数据结构和算法 - 哈希表
Q: 如何快速地存取员工的信息? A: 假设现在要写一个程序,存取一个公司的员工记录,这个小公司大约有1000个员工,每个员工记录需要1024个字节的存储空间,因此整个数据库的大小约为1MB.一般的计 ...
- 哈希表hashTable的Java设计
1:哈希表的概念 2:设计原理 3:哈希表的Java设计
- python数据结构与算法——哈希表
哈希表 学习笔记 参考翻译自:<复杂性思考> 及对应的online版本:http://greenteapress.com/complexity/html/thinkcomplexity00 ...
- 哈希表(散列表)—Hash表解决地址冲突 C语言实现
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.具体的介绍网上有很详 ...
- 哈希表的C实现(一)
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.具体的介绍网上有很详 ...
- java数据结构和算法09(哈希表)
树的结构说得差不多了,现在我们来说说一种数据结构叫做哈希表(hash table),哈希表有是干什么用的呢?我们知道树的操作的时间复杂度通常为O(logN),那有没有更快的数据结构?当然有,那就是哈希 ...
- Java数据结构和算法(十三)——哈希表
Hash表也称散列表,也有直接译作哈希表,Hash表是一种根据关键字值(key - value)而直接进行访问的数据结构.它基于数组,通过把关键字映射到数组的某个下标来加快查找速度,但是又和数组.链表 ...
- 【Java】 大话数据结构(13) 查找算法(4) (散列表(哈希表))
本文根据<大话数据结构>一书,实现了Java版的一个简单的散列表(哈希表). 基本概念 对关键字key,将其值存放在f(key)的存储位置上.由此,在查找时不需比较,只需计算出f(key) ...
随机推荐
- css样式小记
溢出文字展现为... .over-hidd { white-space: nowrap; text-overflow: ellipsis; overflow: hidden; }
- Oracle_单行函数
Oracle_单行函数 --dual是一张虚拟表,用于做测试 select sysdate from dual; select from dual; 字符函数initcap(),lower(), ...
- sudo :apt-get:command not found
在centos下用yum install xxx yum和apt-get的区别 一般来说著名的linux系统基本上分两大类: 1.RedHat系列:Redhat.Centos.Fedora等 2. ...
- speex库音频降噪(含代码)
speex库中音频降噪效果不错,应该是应用最广泛的吧,speex库下载地址https://www.speex.org/downloads/,可以直接下载二进制代码使用,像配置OpenCV一样配置spe ...
- Hibernate 的原生 SQL 查询
Hibernate除了支持HQL查询外,还支持原生SQL查询. 对原生SQL查询执行的控制是通过SQLQuery接口进行的,通过执行Session.createSQLQuery()获取 ...
- vue中组件之间的相互调用,及通用后台管理系统左侧菜单树的迭代生成
由于本人近期开始学习使用vue搭建一个后端管理系统的前端项目,在左侧生成菜单树的时候遇到了一些问题.在这里记录下 分析:由于本人设定的菜单可以使多级结构,直接使用vue的v-for 遍历并不是很方便. ...
- 用C#编写Linux守护进程
如果要在Red Hat Enterprise Linux上将.NET Core进程作为后台进程运行,则可以创建自定义systemd单元.今天我将为.NET Core编写两个自定义系统单元的例子.一个是 ...
- 小打卡PRD
目标:打造一款不同于市场上的公开打卡app的产品 理念:通过监督和鼓励,和相同圈子的人一起互相鼓励.分享及监督,共同进步. 优点: 模板消息通知,网上基本通过小程序中逻辑层JS完成推送的请求,小打卡在 ...
- redis五大类型用法
Redis五大类型:字符串(String).哈希/散列/字典(Hash).列表(List).集合(Set).有序集合(sorted set)五种Controller:@Resource RedisTe ...
- thinkphp5学习(一)——thinkphp5的目录结构与开发规范
开发规范: 目录和文件 目录使用小写+下划线: 类库.函数文件统一以.php为后缀: 类的文件名均以命名空间定义,并且命名空间的路径和类库文件所在路径一致: 类文件采用驼峰法命名(首字母大写),其它文 ...