浅谈hash
hash
算法介绍
hash说得通俗一点,就是给一个变量编上一个马甲
比如说一个人聪明可爱,举世无双,天资聪慧.活泼机灵...,那么就是叫我了(真不要脸
但是这样是不是显得些许麻烦?
于是人类发明了名字
比如你叫张三,那么可以理解为张三就是你的hash值,一提到张三就想到你了,编程中也是一样的
比如我给hello_word编上一个序号为233
那么233所对应的值即为hello_word,当然,hello_word对应值也是233
总之,hash就是将一个不常用的东西,用一个常用的东西取代
hash表示
那么hash值怎么确定呢?
首先明确,hash值是想怎么确定就怎么确定的
比如坐标(x,y),hash值可以设置为xy,xy*y,x^y,y^x,x+y......多种多样,但是怎么选择呢?
hash值定义方法:
1.尽量避免冲突
2.方便整洁
hash常用表达方法:折中表示,乘加迭代...
而我们的重点,则是乘加迭代
hash无法逆推
很显然,带mod的hash是无法逆推的,就像k%453==10不能推出k的值一个道理
乘加迭代
对于一串字符串,我们对于每个字符定义一个值(一般为ascll码)
则hash[i]=hash[i-1]*k+a[i](把它想象成k进制)
这种方法是不会冲突的,而且也可以推出hash[l][r]=hash[i][r]-hash[i][l-1]*k^(r-l+1)(i<l)
但是hash值往往十分巨大,于是往往会设置一个为一个数取模的值,于是hash值便有了一个范围
但是数是无穷无尽的,根据鸽巢原理,一定会产生冲突
那么我们等像个办法解决它
hash冲突
hash冲突的解决方法也是多种多样的
我们平常一般用拉链法和双hash(常用)
拉链法
假设25631hash值和45698,4521的冲突了,为233
那我们在可以设置一个25631->45698->4521的链表
那么我们查取4521是否出现过
那么就在hash值为233的链表里面查取就是了
双hash
这是一个指标不治本的方法
操作:我们对于两个数是否相同,不再通过一个hash值是否相等来判断,而是通过二个hash值是否相等来判断
那么这就大大降低了hash冲突的可能性
例题
思路:
暴力铁定会超时,于是我们想到了hash,只要我们求到子串的值,也就可以判断当前子串是否相等了
考验公式hash(子串l-r)=hash[r]-hash[l-1]*k^(r-l+1)的运用
code:
#include <bits/stdc++.h>
#define ULL unsigned long long
using namespace std;
int ans,len_one,len_two;
ULL k,rec[1000010],p[1000010];
char a[1000010],b[1000010];
int main() {
p[0]=1;
scanf("%s%s",a+1,b+1);
len_one=strlen(b+1);
len_two=strlen(a+1);
for(register int i=1;i<=len_one;i++){
k=k*131+(ULL)(b[i]);
p[i]=p[i-1]*131;
}
for(register int i=1;i<=strlen(a+1);i++)
rec[i]=rec[i-1]*131+(ULL)(a[i]);
for(register int i=len_one;i<=strlen(a+1);i++)
if(rec[i]-rec[i-len_one]*p[len_one]==k)ans++;
printf("%d",ans);
}
函数库简单(即hash)的应用
#include<bits/stdc++.h>
using namespace std;
map <string,int>dis;
int main( ){
int n,i,j,k,l,m=0;
char f[10];
string h;
scanf("%d",&n);
while(n--){
scanf("%s",f+1);
getline(cin,h);
if(f[1]=='f'){
if(dis.count(h))printf("yes\n");
else printf("no\n");
}else{
dis[h]=1;
}
}
}
总结
hash公式hash(子串l-r)=hash[r]-hash[l-1]*k^(r-l+1)
hash常用函数库map来表示
浅谈hash的更多相关文章
- 浅谈Hash函数
什么是hash函数: hash函数也可以翻译成“散列”函数,一般就使用音译“哈希”函数,简单的说哈希函数是对任意长度的输入进行的压缩映射,所谓的压缩映射顾名思义,输出通常来说要比输入短,并且得到的输出 ...
- 浅谈Hash在多个字符串匹配类型问题中的应用
在生活中们有时会遇到一些有关字符串匹配的问题. 这时打暴力往往显得很愚蠢,效率低下. 所以就需要一些算法和数据结构来提高效率. Hash Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把 ...
- 浅谈HASH长度拓展攻击
前言 最近在做CTF题的时候遇到这个考点,想起来自己之前在做实验吧的入门CTF题的时候遇到过这个点,当时觉得难如看天书一般,现在回头望去,仔细琢磨一番感觉也不是那么难,这里就写篇文章记录一下自己的学习 ...
- $.ajax()方法详解 ajax之async属性 【原创】详细案例解剖——浅谈Redis缓存的常用5种方式(String,Hash,List,set,SetSorted )
$.ajax()方法详解 jquery中的ajax方法参数总是记不住,这里记录一下. 1.url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2.type: 要求为Str ...
- 浅谈字符串Hash
浅谈字符串Hash 本篇随笔讲解Hash(散列表)的一个重要应用:字符串Hash. 关于Hash Hash是一种数据结构,叫做Hash表(哈希表),也叫散列表.关于Hash的实现,其实与离散化颇为类似 ...
- Android应用安全开发之浅谈加密算法的坑
<Android应用安全开发之浅谈加密算法的坑> 作者:阿里移动安全@伊樵,@舟海 阿里聚安全,一站式解决应用开发安全问题 Android开发中,难免会遇到需要加解密一些数据内 ...
- 浅谈HTML5单页面架构(二)——backbone + requirejs + zepto + underscore
本文转载自:http://www.cnblogs.com/kenkofox/p/4648472.html 上一篇<浅谈HTML5单页面架构(一)--requirejs + angular + a ...
- 浅谈HTTPS以及Fiddler抓取HTTPS协议
最近想尝试基于Fiddler的录制功能做一些接口的获取和处理工作,碰到的一个问题就是简单连接Fiddler只能抓取HTTP协议,关键的登录请求等HTTPS协议都没有捕捉到,所以想让Fiddler能够同 ...
- 转【】浅谈sql中的in与not in,exists与not exists的区别_
浅谈sql中的in与not in,exists与not exists的区别 1.in和exists in是把外表和内表作hash连接,而exists是对外表作loop循环,每次loop循环再对内表 ...
随机推荐
- Java实现 蓝桥杯VIP 算法提高 3-2字符串输入输出函数
算法提高 3-2字符串输入输出函数 时间限制:1.0s 内存限制:512.0MB 描述 编写函数GetReal和GetString,在main函数中分别调用这两个函数.在读入一个实数和一个字符串后,将 ...
- Java实现 LeetCode 55 跳跃游戏
55. 跳跃游戏 给定一个非负整数数组,你最初位于数组的第一个位置. 数组中的每个元素代表你在该位置可以跳跃的最大长度. 判断你是否能够到达最后一个位置. 示例 1: 输入: [2,3,1,1,4] ...
- Java实现 LeetCode 240 搜索二维矩阵 II
public static boolean searchMatrix(int[][] matrix, int target) { if(matrix.length == 0) return false ...
- java实现杨辉三角系数
** 杨辉三角系数** (a+b)的n次幂的展开式中各项的系数很有规律,对于n=2,3,4时分别是:1 2 1, 1 3 3 1,1 4 6 4 1.这些系数构成了著名的杨辉三角形: 1 1 1 1 ...
- java实现第七届蓝桥杯骰子游戏
骰子游戏 PS: 骰子哪有从0开始的只能是1-6,而他i j k的范围都是0-5,所以都要加1 题目描述 我们来玩一个游戏. 同时掷出3个普通骰子(6个面上的数字分别是1~6). 如果其中一个骰子上的 ...
- java实现第四届蓝桥杯颠倒的价牌
颠倒的价牌 题目描述 小李的店里专卖其它店中下架的样品电视机,可称为:样品电视专卖店. 其标价都是4位数字(即千元不等). 小李为了标价清晰.方便,使用了预制的类似数码管的标价签,只要用颜色笔涂数字就 ...
- java实现第四届蓝桥杯有理数类
有理数类 题目描述 有理数就是可以表示为两个整数的比值的数字.一般情况下,我们用近似的小数表示.但有些时候,不允许出现误差,必须用两个整数来表示一个有理数. 这时,我们可以建立一个"有理数类 ...
- [C#.NET 拾遗补漏]03:你可能不知道的几种对象初始化方式
阅读本文大概需要 1.2 分钟. 随着 C# 的升级,C# 在语法上对对象的初始化做了不少简化,来看看有没有你不知道的. 数组的初始化 在上一篇罗列数组的小知识的时候,其中也提到了数组的初始化,这时直 ...
- zabbix 监控cpu 温度
Zabbix监控Linux主机CPU温度 一.客户端 1.客户Linux主机安装Im_sensors [root@localhost ~]# yum install -y lm-sensors-y ...
- [寒假学习]ps知识
小学就开始学了,还是要感谢当时年轻不懂事到处研究怎么画画哈哈哈哈,不过到现在有点忘,寒假在家禁足也无聊,寻思着重拾画笔来着,复习一下,冲! 为了防止看完就忘用博客记录一下小笔记 1. 一些快捷键的 ...