Hash,一般翻译做散列、杂凑,或音译为哈希。————摘自百度百科

先来看个题:给你一坨一些键值集<key,value>,\(key\)的范围是\([1,10^{10}]\),每次询问\(x\),回答\(key=x\)的\(value\)这种一看就知道暴力不行……于是,有些同学会说:我会用map!但map的查询是 \(O(logn)\)的 QwQ。那么哈希可以怎么做呢?我们可以让\(hash[f(key)]=value\),其中\(f()\)函数被称为哈希函数。至于\(f()\)函数怎么写……想怎么写就怎么写!没错,你想怎么写就怎么写。一般有这么几种方法:

  1. 直接定值法:让\(F(key)=key\)。读者:那不和一般的一样嘛!要你何用?咳咳,总要从最基础的开始嘛……好了,这个方法就此结束。
  2. 折叠法:将关键字分成几部分,取这几部分的和的前几位为哈希地址。例如ISBN码(对就是那道入门题),以0-442-20586-4为例,可以得到其哈希地址是:\(hash = 0442 + 2058 + 64 = 2564\)诶?之前不是说前几位吗?因为这里没有进位啊……如果得到结果是\(10934\),那么其哈希地址就是\(0934\)。
  3. 取余数法:这是\(OI\)中最最常用的,就是对其求余为哈希地址,如\(4325\),模\(233333\)后得\(4325\),那么她的哈希地址就是\(4325\)。

那么现在上面那个问题就好解决了,只要用取余数法求得\(key\)的哈希地址就可以大大压缩空间了!

但是,你不要高兴太早!相信有许多人已经看出来了,哈希的缺点很明显,就是容易出现不同的元素有同一个哈希地址的情况,我们一般称其为:哈希冲突。那么有什么方法能解决哈希冲突呢?有许多方法:

  1. 线性探测再散列:如果多个数有同一个哈希地址,如:0 0 0 34 6 44 0 0注:0表示没有元素。然后又有一个元素\(8\),得到其哈希地址也是4(即34所在的位置),那么我们就往后挪一挪:大哥你先来的,我到后面去。于是来到了6的位置——也被占了,那么再往后移……最后到了7(即44后面那个)。然后查询时只要依次往后找就可以了。
  2. 多重哈希:个人比较喜欢叫双模数,就是进行多次哈希,当然,每次的模数都不一样。如果两次哈希的地址都对应,我才认为是同一个。一般情况下双模数就足够了,所以我喜欢叫双模数。要是有三模数,那基本不会冲突了。
  3. 链地址法:还记得链式前向星吗?(不记得!那还不滚回去学)链式前向星就是把其后面一个一个地链起来,这个也一样,如果哈希地址相同,就链起来。于是乎,我们又想:那开个\(vector\)岂不是又方便又可以解决哈希冲突?没错,我也喜欢用\(vector\)。这两种你用哪一种都没关系,不过还是先提醒一下:\(vector\)有可能会爆哦!这也是为什么大家用链式前向星而不用\(vector\)的原因!(所以我也要开始习惯用链地址法了)。
  4. 建立一个公共溢出区:这个方法我不会!(不会还理直气壮……)所以这里不讲,而且这个方法最后得到的模数不是一个质数,而且其因数很多,是2的次幂,所以……出题人卡你是很容易的!

解决哈希冲突的方法一般就是这些啦!还有个问题,上面提到模数要是质数,为什么呢?原因很简单,根据质数的特性,质数每一个位置都能很好的利用起来,而合数不可以。而且这个质数要大一点(废话,你来个19,玩个鬼哦)。

好,讲完了基础的,来看一看例题:

P3370 【模板】字符串哈希

噫,刚刚只说了整数哈希啊!没关系,记得ASCII码吗?我们可以通过ASCII码,将其转成一个\(base\)进制数,当然,是模过的。然后再用链地址法,对同一哈希值的字符串进行遍历,如果都不相同,加入并更新答案。

具体代码实现:

#include<cstdio>
#include<string>
#include<vector>
#include<iostream>
#define mod 23333
#define base 298
#define rg register
using namespace std;
int n,ans;
string s;
vector<string>v[mod+5];
void insert()
{
int hash=1;//记录哈希值,由于后面要乘所以初值是1
for(rg int i=0;i<s.length();i++)
hash=(1ll*hash*base+s[i])%mod;//1ll就是(long long)1,乘一个1ll,可以保证不爆精度(当然你爆long long或高精度我也没办法)
string t=s;//暂存一下
for(rg int i=0;i<v[hash].size();i++)
if(v[hash][i]==t) return ;//判断,如果有相同的就退出
v[hash].push_back(t);//加入新的字符串
ans++;//更新答案
return ;
}
int main()
{
scanf("%d",&n);
for(rg int i=1;i<=n;i++)
{
cin>>s;
insert();
}
printf("%d",ans);
return 0;
}

哦对了,一般233333(2后面跟一堆3)、100007(1和7中间隔一堆0)、1000009(1和9中间隔一堆0)都是质数。

就讲这么多吧,之后就要靠大家自己实现了!重点还是在多刷题啊!

哈希,hash的更多相关文章

  1. redis 哈希(hash)函数

    哈希(hash)函数 hSet 命令/方法/函数 Adds a value to the hash stored at key. If this value is already in the has ...

  2. redist命令操作(二)--哈希Hash,列表List

    1.Redis 哈希(Hash) 参考菜鸟教程:http://www.runoob.com/redis/redis-hashes.html Redis hash 是一个string类型的field和v ...

  3. Redis中的哈希(Hash)

    Redis 哈希(Hash) Redis hash 是一个string类型的field和value的映射表,hash特别适合用于存储对象. Redis 中每个 hash 可以存储 232 - 1 键值 ...

  4. NSDictionary实现原理-ios哈希hash和isEqual

    NSDictionary实现原理-ios哈希hash和isEqual   OC中自定义类的NSCopying实现的注意事项(isEqual & hash实现) http://blog.csdn ...

  5. 大话Java中的哈希(hash)结构(一)

    o( ̄▽ ̄)d 小伙伴们在上网或者搞程序设计的时候,总是会听到关于“哈希(hash)”的一些东西.比如哈希算法.哈希表等等的名词,那么什么是hash呢? 一.相关概念 1.hash算法:一类特殊的算法 ...

  6. Python操作redis系列以 哈希(Hash)命令详解(四)

    # -*- coding: utf-8 -*- import redis #这个redis不能用,请根据自己的需要修改 r =redis.Redis(host=") 1. Hset 命令用于 ...

  7. Redis 命令,键(key),字符串(String),哈希(Hash),列表(List),集合(Set)(二)

      Redis 命令 Redis 命令用于在 redis 服务上执行操作. 要在 redis 服务上执行命令需要一个 redis 客户端.Redis 客户端在我们之前下载的的 redis 的安装包中. ...

  8. 哈希--Hash,“散列”/“哈希”

    哈希 Hash,翻译“散列”,音译为“哈希”,把任意长度的输入,通过散列算法,变换成固定长度的输出,该输出就是散列值.这种转换是一种压缩映射,也就是散列值的空间通常远小于输入的空间,不同的输入可能会散 ...

  9. 区块链 - 哈希(Hash)

    章节 区块链 – 介绍 区块链 – 发展历史 区块链 – 比特币 区块链 – 应用发展阶段 区块链 – 非对称加密 区块链 – 哈希(Hash) 区块链 – 挖矿 区块链 – 链接区块 区块链 – 工 ...

  10. redis(八):Redis 哈希(Hash)

    Redis 哈希(Hash) Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象. Redis 中每个 hash 可以存储 232 ...

随机推荐

  1. Ant Design Pro入门教程,安装,运行(V5 Typescript版)

    [前言] 找了很多Admin模板,最后还是看中了AntDesignPro这个阿里巴巴开源的Admin框架,长这样(还行吧,目前挺主流的): 官网地址:https://pro.ant.design/in ...

  2. Java 集合框架综述,这篇让你吃透!

    一.集合框架图 简化图: 说明:对于以上的框架图有如下几点说明 1.所有集合类都位于java.util包下.Java的集合类主要由两个接口派生而出:Collection和Map,Collection和 ...

  3. 算法面试题:一个List<Student>,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

    算法面试题:一个List,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点! 解题思路 这是群里某位小伙伴去面试碰到的面试题,从题目本身来看,面试官应该是要考察面试者对泛型 Lis ...

  4. C#LeetCode刷题之#720-词典中最长的单词(Longest Word in Dictionary)

    问题 该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/4120 访问. 给出一个字符串数组words组成的一本英语词典.从 ...

  5. Android 开发学习进程0.19 webview 的使用

    Android 中的webview android 中的webview是可以在app内部打开HTML等的网页,不必再打开浏览器,有两种实现方法,即webviewclient webChromeclie ...

  6. mysql-5.7.xx在lcentos7下的安装以及mysql在windows以及linux上的性能差异

    前言: 在centos上安装mysql,整整折腾了将近一天,因为是第一次安装,的确是踩了不少坑,这里详细记录下来,方便各位有同样需求的小伙伴参考. 该选择什么版本? mysql5.7有很多小版本,但是 ...

  7. DNF手游公测或将只有安卓版 iOS系统怎么办?

    DNF手游在8月10号确定延期后,目前还不知道新的上线时间.玩家都很关心DNF手游新的公测时间,DNF手游官网的预约数据也是不断突破新高,最终突破了五千万!我们目前拿到的小道消息,DNF手游会在9月1 ...

  8. API、Win32 SDK、Win32项目、MFC、Windows窗体应用程序的区别

    [原]API.Win32 SDK.Win32项目.MFC.Windows窗体应用程序的区别 首先来看一下每一个术语的定义: API:Application Programming Interface. ...

  9. 笔记:CSS基础

    一.CSS(层叠式样式表),决定页面怎么显示元素 1.引入方式: 行内样式,在当前标签元素中直接使用 style 的属性. 内嵌方式,在<head>中写样式: 外链式,<link&g ...

  10. linux服务器核心知识

    电脑:辅助人脑的工具 现在的人们几乎无时无刻都会碰电脑!不管是桌上型电脑(桌机).笔记型电脑(笔电).平板电脑.智慧型手机等等,这些东西都算是电脑.虽然接触的这么多,但是,你了解电脑里面的元件有什么吗 ...