字符串HASH 学习总结 && 模板
一、字符串HASH模板 取自挑战程序设计竞赛(第2版)
</pre><pre code_snippet_id="446698" snippet_file_name="blog_20140809_1_9461278" name="code" class="cpp">/*===================================================*\
从b串中寻找和a串长度同样的子串,返回開始位置
不保证绝对正确,发生冲突概率为O(sqrt(n)),
n为哈希函数的最大值
\*===================================================*/ #define ull unsigned long long
const ull B = 1e8+7; /*according to the book*/
const int MAXN = 1001;
char a[MAXN],b[MAXN]; int HashFind()/*返回匹配位置的開始处的下标,-1表示没有匹配*/
{
int al=strlen(a),bl=strlen(b);
if(al>bl)return -1;
ull t=1,ah=0,bh=0;
for(int i=0;i<al;i++)
{
t*=B;
ah=ah*B+a[i];
bh=bh*B+b[i];
}
for(int i=0;i+al<=bl;i++)
{
if(ah == bh)return i;
if(i+al < bl)bh=bh*B+b[i+al]-b[i]*t;
}
return -1;
} /*===================================================*\
滚动哈希--滚动通过ull的溢出实现,相当于mod 2^64 \*===================================================*/ #define ull unsigned long long
const int MAXN = 1001;
const ull B = 1e8+7; /*according to the book*/
char a[MAXN],b[MAXN]; int OverLap()/*a的后缀和b的前缀相等的最大长度*/
{
int al=strlen(a),bl=strlen(b),ans=0;
int minlen=min(al,bl);
ull t=1,ah=0,bh=0;
for(int i=1;i<minlen;i++)
{
ah=ah+a[al-i]*t;
bh=bh*B+b[i-1];
if(ah == bh)ans=i;
t*=B;
}
return ans;
}
二、字符串HASH的求法:(注意我不同颜色标记的地方,假设WA,一定看看那里是不是写对了)
1、直接ah[i]=ah[i-1]*base+a[i],那么长度为len的哈希值就是ah[i]-ah[i-len]*base[len] 此处ah[i]表示长为i字符串的哈希值
北京邀请赛的题,为了能做到在O(1)时间内算出hash值---比方算从l到r这段字符串的hash值,能够直接ah[r]-ah[l-1](当然须要推断l>=1,或者直接字符串从下标为1開始)。便于进行二分,就是这么写的
http://blog.csdn.net/u011026968/article/details/38473707
2、逐步递推:hash[i]=hash[i-1]*base+a[i]-a[i-len]*base[len] 再写字符矩阵匹配的时候两种写法我弄混了...o(╯□╰)o
三、HASH的其它构造方法:
1、假设限定了字符数目,能够映射为对应进制的数,如http://blog.csdn.net/u011026968/article/details/38490653
字符串HASH 学习总结 && 模板的更多相关文章
- 字符串Hash学习笔记
[toc] # 以下内容作废,太多错误了,等我有时间重写 说一下什么是Hash,说白了就是把一大坨字符用一些神奇的数来表示,可以说是把字符加密了. 简单一点就是一个像函数一样的东西,你放进去一个值,它 ...
- hdu 4622 Reincarnation 字符串hash 模板题
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4622 题意:给定一个长度不超过2000的字符串,之后有不超过1e5次的区间查询,输出每次查询区间中不同 ...
- cf244D. Match & Catch 字符串hash (模板)或 后缀数组。。。
D. Match & Catch 能够用各种方法做.字符串hash.后缀数组,dp.拓展kmp,字典树.. . 字符串hash(模板) http://blog.csdn.net/gdujian ...
- 字符串hash + 二分答案 - 求最长公共子串 --- poj 2774
Long Long Message Problem's Link:http://poj.org/problem?id=2774 Mean: 求两个字符串的最长公共子串的长度. analyse: 前面在 ...
- HDU-魔咒词典(字符串hash)
魔咒词典 TimeLimit: 8000/5000 MS (Java/Others) MemoryLimit: 32768/32768 K (Java/Others) 64-bit integer ...
- 字符串hash入门
简单介绍一下字符串hash 相信大家对于hash都不陌生 翻译过来就是搞砸,乱搞的意思嘛 hash算法广泛应用于计算机的各类领域,像什么md5,文件效验,磁力链接 等等都会用到hash算法 在信息学奥 ...
- I - Magic FZU - 2280 (字符串hash)
题目链接: I - Magic FZU - 2280 学习链接: FZU - 2280 I - Magic 题目大意: 给你nn个字符串,每个字符串有一个值ww,有qq次询问,一共两种操作:一是“1, ...
- Spring Boot学习记录(二)--thymeleaf模板 - CSDN博客
==他的博客应该不错,没有细看 Spring Boot学习记录(二)--thymeleaf模板 - CSDN博客 http://blog.csdn.net/u012706811/article/det ...
- 【字符串算法1】 再谈字符串Hash(优雅的暴力)
[字符串算法1] 字符串Hash(优雅的暴力) [字符串算法2]Manacher算法 [字符串算法3]KMP算法 这里将讲述 [字符串算法1] 字符串Hash 老版原文: RK哈希(Rabin_Ka ...
随机推荐
- The Pragmatic Programmer 读书笔记
--在所有的弱点中,最大的弱点就是害怕暴露弱点. --责任是你主动担负的东西.你承诺确保某件事情正确完成,但你不一定能直接控制事情的每一个方面.除了尽你所能以外,你必须分析风险是否超出了你的控制.对于 ...
- [BZOJ4561][JLOI2016]圆的异或并(扫描线)
考虑任何一条垂直于x轴的直线,由于圆不交,所以这条直线上的圆弧构成形似括号序列的样子,且直线移动时圆之间的相对位置不变. 将每个圆拆成两边,左端加右端删.每次加圆时考虑它外面最内层的括号属于谁.用se ...
- SQL SERVER 扩展属性的操作方法
将数据库迁移到 Azure SQL 数据库时出现错误,不支持扩展属性“MS_Description”,因此就如何操作扩展属性进行在此记录. 查询扩展属性 SELECT *,OBJECT_NAME(ma ...
- bzoj 2998 第k小字串
这道题用后缀数组貌似会T. 后缀自动机做法: t==0:第k小的本质不同字串 首先把后缀自动机建出来,我们会得到一个DAG,并且只存在一个点入度为0(我们称之为根),可以证明字符串的任意一个本质不同的 ...
- ZOJ 3626 Treasure Hunt I 树上DP
E - Treasure Hunt I Time Limit:2000MS Memory Limit:65536KB Description Akiba is a dangerous country ...
- C#高级编程9-第2章 核心C#
C#基础 使用C#命名编译器csc.exe,编译C#程序 变量 变量一般初始化后才能使用 类型判断弱类型var,根据初始值判断类型, 变量作用域,可以访问该代码的区域 类中定义的成员变量和属性,作用在 ...
- IO流-递归遍历目录下指定后缀名结尾的文件名称
/* *自定义遍历目录下指定后缀名结尾文件的名称的方法: * * param file:指定目录 name:指定后缀名 */ 1 public static void FileName(File fi ...
- Git_创建标签
在Git中打标签非常简单,首先,切换到需要打标签的分支上: $ git branch * dev master $ git checkout master Switched to branch 'ma ...
- redis-py说明文件(转)
转自:http://blog.sina.com.cn/s/blog_6262a50e0101574h.html 原文:https://github.com/andymccurdy/redis-py r ...
- 计算机音频基础-PCM简介
我们在音频处理的时候经常会接触到PCM数据:它是模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志. 声音本身是模拟信号,而计算机只能识别数字信号,要在计算 ...