算法竞赛进阶指南0x14 Hash
组成部分:
- 哈希函数;
- 链表
AcWing137. 雪花雪花雪花
因为所需要数据量过于大,所以只能以O(n)的复杂度。
所以不可能在实现的过程中一一顺时针逆时针进行比较,所以采用一种合适的数据结构。
如果使用set里面存储pair套上pair,维护起来稍微有一点麻烦。
取一个两片相同雪花都有的共同特征,(不同的重复也没事)。
tips:
如果已经发现两片雪花不一样,直接return 0即可。
普及一个比较大的质数:
99991
#include <bits/stdc++.h>
using namespace std;
#define N 100010
int buf[12];
int snow[N][8], nxt[N], ver[N], head[N];
int tot;
#define PRI 99991
int Hash()
{
int sum = 0, mul = 1;
for(int i = 0; i < 6; i++)
{
sum = (buf[i]+sum) % PRI;
mul = (long long)mul * buf[i] % PRI;
}
return (sum+mul)%PRI;
}
bool Compare(int id)//如果返回1,那么说明就有冲突。(比较方法:最暴力的比较方法)
{
for(int i = 0; i < 6; i++)
for(int j = 0; j < 6; j++)
{
bool eq = true;
for(int k = 0; k < 6; k++)
{
if(buf[(k+i)%6] != snow[id][(k+j)%6])
{
eq = false;
break;
}
}
if(eq) return 1;
eq = true;
for(int k = 0; k < 6; k++)
{
if(buf[(k+i)%6] != snow[id][(12+j-k)%6])
{
eq = false;
break;
}
}
if(eq) return 1;
}
return 0;
}
bool Insert()
{
int H = Hash();
for(int i = head[H]; i; i = nxt[i])
{
if(Compare(ver[i]))
return 1;
}
tot++;
memcpy(snow[tot], buf, 6*sizeof(int));
ver[tot] = tot;
nxt[tot] = head[H];
head[H] = tot;
return 0;
}
int main()
{
int n;
cin >> n;
for(int i = 1; i <= n; i++)
{
for(int j = 0; j < 6; j++)
scanf("%d", buf+j);
if(Insert())
{
printf("Twin snowflakes found.");
return 0;
}
}
printf("No two snowflakes are alike.");
return 0;
}
ver其实没有任何作用,因为每一条“边”的编号,就是这片雪花的存储位置。
字符串哈希:
把一个任意长度的字符串映射成一个非负整数,冲突的概率几乎为0。
方法步骤:
- 把字符串看做p进制数(p要取131或者13331)
- 每一种字符分配一个大于等于0的数字(使得分配到的数字远小于p)。
- 对构造出来的哈希值一直取模。(可以使用unsigned long long来进行)
一般来说,通过这种方法构造出来的Hash值是唯一的。
如果不放心的话,可以多取几组p,如果全部相等,才能认为字符串相等。
题型一:通过哈希来确定子串是否相等
对于一个灰常长的字符串,可以使用
O
(
n
)
O(n)
O(n)的时间维护出前缀数组的Hash值。然后可以使用
O
(
1
)
O(1)
O(1)的时间来求出子串的Hash。
在这道题目中,使用f数组存放前缀的Hash,使用p存放131^次方。
#include <bits/stdc++.h>
using namespace std;
#define N 1000010
unsigned long long f[N], p[N];
char s[N];
void Init()
{
p[0] = 1;
int len = strlen(s+1);
for(int i = 1; i <= len; i++)
{
f[i] = f[i-1] * 131 + s[i] - 'a' + 1;
p[i] = 131 * p[i-1];
}
}
int main()
{
scanf("%s", s+1);
Init();
int n;
cin >> n;
for(int i = 1; i <= n; i++)
{
int a, b, c, d;
scanf("%d%d%d%d", &a, &b, &c, &d);
unsigned long long h1 = f[b] - f[a-1]*p[b-a+1];
unsigned long long h2 = f[d] - f[c-1]*p[d-c+1];
if(h1 == h2) printf("Yes\n");
else printf("No\n");
}
return 0;
}
题型二:判断最长回文子序列
方法一(最最最暴力)
由于回文串分为奇回文串还有偶回文串,枚举N+N-1个端点,然后向两边进行拓展,可以达到目的
时间复杂度
O
(
n
2
)
O(n^2)
O(n2)
方法二(从方法一改进)
- 有了Hash这个工具之后,判断一个字符时间复杂度是
O
(
1
)
O(1)
O(1)的,判断任意长度字符串时间复杂度是
O
(
1
)
O(1)
O(1)的
- 由于最长回文子序列具有单调的性质。
所以通过二分加Hash可以以**
O
(
N
l
o
g
2
N
)
O(Nlog_2N)
O(Nlog2N)**解出。
二分条件:
- 一次查询时间复杂度是
O
(
1
)
O(1)
O(1)
- 具有单调性
方法三(manacher算法)
算法精髓:
- 利用了回文串的性质(如果一个位置在一个回文串里面,就可以通过之前算出的值线性地求出这个位置的值)
- 如果不在回文串里,那么就暴力拓展(虽说是暴力,但是可以为后人而栽树,右边界拓展到哪里,那么在这一段里面就不需要拓展了)
- 使用了分隔符,?#a#b#a#@,可以把奇回文串还有偶回文串联合起来考虑。
- 同时,从分隔符中找规律,声明:计从该点开始向右移动,直到移动到左右不相等的数所移动的步数就是p[i]的值。
- 对于每一个p[i]它的值减去一,就是以这个字符为中心的回文串的长度
but貌似好像只能解决这类问题。。
代码
#include <bits/stdc++.h>
using namespace std;
#define N 1000010
char ss[N];
char s[N*2+10];
int p[N*2+10];
int ans = 0;
void process()
{
int len = strlen(ss+1);
int q = 0;
s[++q] = '?';
s[++q] = '#';
for(int p = 1; p <= len; p++)
{
s[++q] = ss[p];
s[++q] = '#';
}
s[++q] = '@';//注意:首末一定是不一样的!!!
}
void manacher()
{
int len = 0;
while(s[len] != '@') len++;
int R = 0, mid = 0;
for(int i = 2; i <= len-1; i++)
{
if(R > i) p[i] = min(p[2*mid - i], R-i);//把情况3,4和情况二筛选出来
else p[i] = 1;//情况一
while(s[i-p[i]] == s[i+p[i]]) p[i]++;//注意:不仅仅是针对情况一,还针对情况三
if(i+p[i] > R)
{
R = i+p[i];
mid = i;
}
ans = max(ans, p[i]-1);
}
}
int main()
{
int cnt = 1;
while(1)
{
//memset(s, 0, sizeof(s));
//memset(ss, 0, sizeof(ss));
memset(p, 0, sizeof(p));
ans = 0;
scanf("%s", ss+1);
if(ss[1] == 'E') return 0;
process();
manacher();
printf("Case %d: %d\n",cnt, ans);
cnt++;
}
return 0;
}
参考博客:https://blog.csdn.net/rwbyblake/article/details/107991949
manacher的总结:
ACWing\140. 后缀数组
由于字符串哈希可以求出字符串的任意两个子串是否相等,所以如果可以采用二分,时间复杂度降低为logN。
#include <bits/stdc++.h>
using namespace std;
#define N 300010
typedef unsigned long long ull;
char s[N];
ull p[N];
ull H[N];
int SA[N];
int len;
int Height[N];
void hash_process()
{
p[0] = 1;
for(int i = 1; i <= len; i++)
{
H[i] = 131*H[i-1] + s[i] - 'a' + 1;
p[i] = p[i-1] * 131;
}
}
inline unsigned long long Hash(int l, int r)
{
return H[r] - H[l-1] * p[r-l+1];
}
bool my_compare(int x, int y)
{
int xlen = len-x+1;
int ylen = len-y+1;
int r = min(xlen, ylen);
int l = 0;
while(l < r)
{
int mid = (l+r) / 2;
if(Hash(x, x+mid) != Hash(y, y+mid)) r = mid;
else l = mid + 1;
}
if(s[x+r] < s[y+r]) return true;
else if(s[x+r] > s[y+r]) return false;
else
{
if(ylen > xlen) return true;
else return false;
}
}
int longest_pre(int x, int y)
{
int xlen = len-x+1;
int ylen = len-y+1;
int r = min(xlen, ylen);
int l = 0;
while(l < r)
{
int mid = (l+r) / 2;
if(Hash(x, x+mid) != Hash(y, y+mid)) r = mid;
else l = mid + 1;
}
return l;
}
int main()
{
scanf("%s", s+1);
len = strlen(s+1);
for(int i = 1; i <= len; i++) SA[i] = i;
hash_process();
sort(SA+1, SA+1+len, my_compare);
for(int i = 1; i <= len; i++) printf("%d ", SA[i]-1);
Height[1] = 0;
for(int i = 2; i <= len; i++)
{
Height[i] = longest_pre(SA[i], SA[i-1]);
}
putchar('\n');
for(int i = 1; i <= len; i++) printf("%d ", Height[i]);
return 0;
}
算法竞赛进阶指南0x14 Hash的更多相关文章
- 《算法竞赛进阶指南》0x10 基本数据结构 Hash
Hash的基本知识 字符串hash算法将字符串看成p进制数字,再将结果mod q例如:abcabcdefg 将字母转换位数字(1231234567)=(1*p9+2*p8+3*p7+1*p6+2*p5 ...
- 《算法竞赛进阶指南》1.4Hash
137. 雪花雪花雪花 有N片雪花,每片雪花由六个角组成,每个角都有长度. 第i片雪花六个角的长度从某个角开始顺时针依次记为ai,1,ai,2,-,ai,6. 因为雪花的形状是封闭的环形,所以从任何一 ...
- bzoj 1787 && bzoj 1832: [Ahoi2008]Meet 紧急集合(倍增LCA)算法竞赛进阶指南
题目描述 原题连接 Y岛风景美丽宜人,气候温和,物产丰富. Y岛上有N个城市(编号\(1,2,-,N\)),有\(N-1\)条城市间的道路连接着它们. 每一条道路都连接某两个城市. 幸运的是,小可可通 ...
- POJ1639 算法竞赛进阶指南 野餐规划
题目描述 原题链接 一群小丑演员,以其出色的柔术表演,可以无限量的钻进同一辆汽车中,而闻名世界. 现在他们想要去公园玩耍,但是他们的经费非常紧缺. 他们将乘车前往公园,为了减少花费,他们决定选择一种合 ...
- 算法竞赛进阶指南 0x00 基本算法
放在原来这个地方不太方便,影响阅读体验.为了读者能更好的刷题,另起一篇随笔. 0x00 基本算法 0x01 位运算 [题目][64位整数乘法] 知识点:快速幂思想的灵活运用 [题目][最短Hamilt ...
- 算法竞赛进阶指南--快速幂,求a^b mod p
// 快速幂,求a^b mod p int power(int a, int b, int p) { int ans = 1; for (; b; b >>= 1) { if (b &am ...
- 《算法竞赛进阶指南》1.6Trie
142. 前缀统计 给定N个字符串S1,S2-SN,接下来进行M次询问,每次询问给定一个字符串T,求S1-SN中有多少个字符串是T的前缀. 输入字符串的总长度不超过106,仅包含小写字母. 输入格式 ...
- 《算法竞赛进阶指南》 1 (P4) a^b 快速幂
快速幂 #include<cstdio> #include<cmath> #include<iostream> using namespace std; long ...
- POJ1722 算法竞赛进阶指南 SUBSTRACT减操作
原题连接 题目描述 给定一个整数数组\(a_1,a_2,-,a_n\). 定义数组第 i 位上的减操作:把\(a_i\)和\(a_{i+1}\)换成\(a_i - a_{i+1}\). 用con(a, ...
随机推荐
- 一文搞懂CDN加速原理
开源Linux 长按二维码加关注~ 一.什么是 CDN CDN的全称是(Content Delivery Network),即内容分发网络.其目的是通过在现有的Internet中增加一层新的CACHE ...
- 老生常谈系列之Aop--CGLIB动态代理的底层实现原理
老生常谈系列之Aop--CGLIB动态代理的底层实现原理 前言 上一篇老生常谈系列之Aop--JDK动态代理的底层实现原理简单讲解了JDK动态代理的实现,动态代理常用实现里面的双子星还有另一位--CG ...
- zabbix5.0报错PHP时区未设置(配置参数"date.timezone")
解决办法 : #1.编辑文件/etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf,取消注释并设置为所在地时区 vim /etc/opt/rh/rh-php72/php- ...
- Java学习,利用IDEA开发工具连接redis
Idea连接redis及Jedis数据操作 注意是否开启了redis服务!!! 1.打开虚拟机终端,查看虚拟机防火墙是否关闭 查看防火墙当前状态命令: $sudo ufw status 我的是默认关闭 ...
- 提升站点SEO的7个建议
1.使用HTTPS 谷歌曾发公告表示,使用安全加密协议(HTTPS),是搜索引擎排名的一项参考因素. 所以,在域名相同情况下,HTTPS站点比HTTP站点,能获得更好的排名. 在网络渠道分发或合作上, ...
- linux篇-公司网络故障那些事(路由器变交换机)
首先这次网络故障是断电引起的 我给大家画个模型 三层的为八口交换机 一层的为五口打印机 笔记本代表两台无线打印机 首先八口的连接了公司采购电脑一台,业务电脑一台,其他电脑三台 第二个五口交换的连接财务 ...
- 好客租房23-react组件的两种创建方式(抽离为独立js)
2.3抽离为单独组件 组件作为一个单独的个体,一般把每个组件放在单独的js中文件中 1创建hello.js 2在hello.js中导入React 3创建组件(函数或者类) hello.js子组件 // ...
- MongoDB 各项命名规范
每日一句 Progress is the result of a bunch of failures. 进步是不断失败的成果. 概述 MongoDB涉及到的一些比如集合啥的命令规范. 集合的命名规范 ...
- hexo + typora 图片插入解决办法
Typora 是一款知名的 Markdown 编辑器,简单好用,体验良好.使用 hexo 搭建好博客后,主要是用 Markdown 来编写博客,typora 便是我的首选编辑器.但直接使用 typor ...
- js 定时器 Timer
1 /* Timer 定时器 2 3 parameter: 4 func: Function; //定时器运行时的回调; 默认 null 5 speed: Number; //延迟多少毫秒执行一次 f ...