Hash 哈希(上)

Hash 哈希(上)

简介

Hash，又称散列，它通过对数据进行计算，得出该数据的对应位置，使得数据和存放位置相对应，从而完成高效的查找。

Hash函数的构造

取余法

用关键字\(k\)除以\(M\)，取余数作为地址。

\[\operatorname h(k)=k \bmod M
\]

经验上\(P\)可以为\(k\)的取值可能数的1~2倍范围内的素数或\(k\)的取值可能数本身。

这类函数主要用于整数。

乘积取整法

用关键字\(k\)乘一个在\((0,1)\)中的实数\(A\)（最好是无理数），取其小数部分，乘\(M\)并取整，作为地址。

\[\operatorname h(k)=\left\lfloor{M(kA\bmod1)}\right\rfloor
\]

经验上\(A\)可以为\(\dfrac{\sqrt{5}-1}{2}\)。

这类函数主要用于小数。

其他方法

自身函数：取\(k\)的某个线性函数值作为地址。

\[\operatorname h(k)=a\times k+b
\]

平方取中法：将\(k\)平方后取中间几位作为地址。
折叠法：将\(k\)分成位数相等的几段，但最后一段可以不同，最后相加作为地址。

冲突的处理

大部分的散列表无法避免冲突(废话) 。因此需要一些数据结构来解决这些冲突。

挂链法

顾名思义，当出现冲突时，用链表将这两个关键字连起来。看看代码有点像向量存图：

const int array_size=1e5+5;//数组大小

vector<int>lis[array_size];

void get_hash(int key)//加入一个值为key的元素

{

	int buc=f(key);

	lis[buc].push_back(key);

}

bool check(int key)//查找一个元素是否存在于Hash表中

{

	int buc=f(key);

	for(int i=0;i<lis[buc].size();i++)

		if(lis[buc][i]==key)

			return true;

	return false;

}

在键值均匀分布的前提下，挂链法操作的时间复杂度为\(O(n\texttt{length}(\texttt{Hash table}))\)。

开放定址法

这种方法将所有元素直接存于散列表中，因此散列表大小不能小于元素个数。开放定址法中有一个特殊的函数\(H(x,k)\)，指明如果前\(k\)次访问失败，下一次应访问哪一个位置。这个函数有三种构造方式：

线性探查法

\[\operatorname H(x,k)=(x+1)\bmod \text {array_size}
\]

二次探查法

\[\operatorname H(x,k)=(x+k^2)\bmod \text{array_size}
\]

双哈希法

这种方法需要引入一个新的\(Hash\)函数\(newh(x)\):

\[\operatorname H(x,k)=(x,k\times newh(x))\bmod\text{array_size}
\]

其中线性探查法有最优的缓存访问与计算消耗，二次探查法次之，双哈希法最劣。不过双哈希法的概率相等，能够避免“聚集”，即大量\(Hash\)值接近的情况。

三种方法代码类似：

const int array_size=1e5+5;//数组大小

int val[array_size];

int H(int buc,int opercnt){…}//上文提到的函数

void get_hash(int key)//加入元素操作

{

    int buc=f(key,array_size);

    while(val[buc]!=key&&val[buc])

        buc=(buc==array_size-1?0:buc+1);

    val[buc]=key;

}

bool check(int key)//查询元素操作

{

    int buc=f(key,array_size),opercnt=0;

    while(val[buc]!=key&&val[buc])

        buc=H(buc,opercnt++);

    return val[buc]==key;

}

在键值均匀分布的前提下，开放定址法时间复杂度为\(O(\texttt{length(Hash table)/(length(Hash table)}-n))\)

结语

以上是一些Hash的常用方法，限于篇幅这里仅提到了数值的哈希。

Hash还有更多的骚操作应用，如字符串哈希，排列哈希，树或图的哈希，Hash哈希（下）会提到的(光速逃

\[\xrightarrow{\qquad}To\;be\;continued\cdots
\]

Hash 哈希(上)的更多相关文章

上传图片用图片文件的对象hash哈希值判断图片是否一样，避免重复提交相同的图片到服务器中
上传图片用图片文件的对象hash哈希值判断图片是否一样,避免重复提交相同的图片到服务器中前端:要用到一个插件,点击下载 <!DOCTYPE html> <html xmlns=&q ...
hash 哈希查找复杂度为什么这么低？
hash 哈希查找复杂度为什么这么低? (2017-06-23 21:20:36) 转载▼ 分类: c from: 作者:jillzhang 出处:http://jillzhang.cnblogs ...
Hash哈希（一）
Hash哈希(一) 哈希是大家比较常见一个词语,在编程中也经常用到,但是大多数人都是知其然而不知其所以然,再加上这几天想写一个一致性哈希算法,突然想想对哈希也不是很清楚,所以,抽点时间总结下Hash知 ...
redis:hash哈希类型的操作
1. hash哈希类型的操作 1.1. hset key field value 语法:hset key field value 作用:把key中field域的值设为value 注:如果没有field ...
第二百九十六节，python操作redis缓存-Hash哈希类型，可以理解为字典类型
第二百九十六节,python操作redis缓存-Hash哈希类型,可以理解为字典类型 Hash操作,redis中Hash在内存中的存储格式如下图: hset(name, key, value)name ...
Hash哈希（二）一致性Hash（C++实现）
一致性Hash 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,经常用于分布式.负载均衡等. 原理一致哈希是 ...
Hash(哈希)
一.基本概念 Hash,一般翻译做"散列",也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的 ...
Redis[三] @Hash 哈希
Redis的哈希值是字符串字段和字符串值之间的映射,所以他们是表示对象的完美数据类型在Redis中的哈希值,可存储超过400十亿键值对. redis 提供了2套操纵一种是批量一种是非批量假设需 ...
python hash 哈希值
自增知识点 1,哈希什么是可哈希(hashable)? 简要的说可哈希的数据类型,即不可变的数据结构(字符串str.元组tuple.对象集objects). 哈希有啥作用? 它是一个将大体量数据转化 ...

随机推荐

SpringBoot2.3中@Async实现异步
启动加上@EnableAsync ,需要执行异步方法上加入@Async. 在方法上加上@Async之后底层使用多线程技术. 不使用异步先关代码: package com.yiyang.myfirs ...
STM32与CH455g通信测试（仅键盘）
1.概述 CH455是数码管显示驱动和键盘扫描控制芯片.CH455内置时钟振荡电路,可以动态驱动4位数码管或者32只LED:同时还可以进行28键的键盘扫描:CH455通过SCL和SDA组成的2线串行接 ...
Python3基础——递归
递归函数如果一个函数在内部调用自身本身,这个函数就是递归函数. 递归函数的优点是定义简单,逻辑清晰.理论上,所有的递归函数都可以写成循环的方式,但循环的逻辑不如递归清晰. 使用递归函数需要注意防止栈 ...
对于dijkstra最短路算法的复习
好久没有看图论了,就从最短路算法开始了. dijkstra算法的本质是贪心.只适用于不含负权的图中.因为出现负权的话,贪心会出错. 一般来说,我们用堆(优先队列)来优化,将它O(n2)的复杂度优化为O ...
Git操作常用的命令都在这里了。
创建仓库 git init 在当前目录执行,会生成 .git目录文件,这个和SVN一致. 提交到仓库 git commit -m "first commit" -m:表示提交描述, ...
TP5 调用快递鸟api 查询快递信息
1,去快递鸟,下载sdk https://www.kdniao.com/api-track 下载PHPsdk 2,下载下来的事PHP文件,不是以类的形式显示的,所以为了方便,我把他封装成了类,不需要封 ...
git 本地回滚到上一个版本
linux下是 git reset --hard HEAD^ windows下是 git reset --hard HEAD"^"
【linux】基础命令一
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ mount dir[] device[]umount devic[]maste ...
K8S节点异常怎么办？TKE"节点健康检查和自愈"来帮忙
节点健康检测意义在K8S集群运行的过程中,节点常常会因为运行时组件的问题.内核死锁.资源不足等各种各样的原因不可用.Kubelet默认对节点的PIDPressure.MemoryPressure. ...
uc浏览器手机版,页面图片不显示
uc浏览器手机版,有时候上面的轮播广告看不到原因:uc浏览器会拦截所有带ad的标签例如: <div id="adDiv"> <img src="/r ...

Hash 哈希(上)

Hash 哈希(上)

简介

Hash函数的构造

取余法

乘积取整法

其他方法

冲突的处理

挂链法

开放定址法

线性探查法

二次探查法

双哈希法

结语

Hash 哈希(上)的更多相关文章

随机推荐

热门专题