后缀数组（SA）学习记录

一只只会后缀自动机却不会后缀数组的弱鸡做了一下HDU - 1403,结果SAM被卡内存了，然后学习了一下SA。

以下两道题都是求LCS，区别在于字符串长度。

参考blog：https://www.cnblogs.com/victorique/p/8480093.html

HDU - 1403

 #include <iostream>

 #include <stdio.h>

 #include <string.h>

 #include <algorithm>

 #define rank Rank

 using namespace std;

 const int MAXN = 2e5+;

 char str[MAXN];

 int SA[MAXN], rank[MAXN], height[MAXN], sum[MAXN], tp[MAXN];

 //rank[i] 第i个后缀的排名, SA[i] 排名为i的后缀的位置, Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP

 //sum[i] 基数排序辅助数组, 存储小于i的元素有多少个, tp[i] rank的辅助数组(按第二关键字排序的结果),与SA意义一样

 bool cmp(int *f, int x, int y, int w){return f[x] == f[y] && f[x + w] == f[y + w];}

 void get_SA(char *s, int n, int m)

 {

     for(int i = ; i < m; i++) sum[i] = ;

     for(int i = ; i < n; i++) sum[rank[i] = s[i]]++;

     for(int i = ; i < m; i++) sum[i] += sum[i - ];

     for(int i = n - ; i >= ; i--) SA[--sum[rank[i]]] = i;

     for(int len = ; len <= n; len <<= )

     {

         int p = ;

         for(int i = n - len; i < n; i++) tp[p++] = i;

         for(int i = ; i < n; i++)

             if(SA[i] >= len)

                 tp[p++] = SA[i] - len;

         for(int i = ; i < m; i++) sum[i] = ;

         for(int i = ; i < n; i++) sum[rank[tp[i]]]++;

         for(int i = ; i < m; i++) sum[i] += sum[i - ];

         for(int i = n - ; i >= ; i--) SA[--sum[rank[tp[i]]]] = tp[i];

         swap(rank, tp);

         p = ;

         rank[SA[]] = ;

         for(int i = ; i < n; i++)

             rank[SA[i]] = cmp(tp, SA[i - ], SA[i], len) ? p -  : p++;

         if(p >= n) break;

         m = p;

     }

     int k = ;

     n--;

     for(int i = ; i <= n; i++) rank[SA[i]] = i;

     for(int i = ; i < n; i++)

     {

         if(k) k--;

         int j = SA[rank[i] - ];

         while(s[i + k] == s[j + k]) k++;

         height[rank[i]] = k;

     }

 }

 int main()

 {

     while(~scanf("%s", str))

     {

         int len = strlen(str);

         str[len] = '';

         scanf("%s", str + len + );

         int n = strlen(str);

         str[n] = ; //末尾添加一个0

         get_SA(str, n + , 'z' + );

         int sol = ;

         for(int i = ; i < n; i++)

         {

             if(SA[i] > len && SA[i - ] < len) sol = max(sol, height[i]);

             if(SA[i] < len && SA[i - ] > len) sol = max(sol, height[i]);

         }

         printf("%d\n", sol);

     }

     return ;

 }

SPOJ - LCS

SA版本：

 #include <iostream>

 #include <stdio.h>

 #include <string.h>

 #include <algorithm>

 #define rank Rank

 using namespace std;

 const int MAXN = 5e5+;

 char str[MAXN];

 int SA[MAXN], rank[MAXN], height[MAXN], sum[MAXN], tp[MAXN];

 //rank[i] 第i个后缀的排名, SA[i] 排名为i的后缀的位置, Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP

 //sum[i] 基数排序辅助数组, 存储小于i的元素有多少个, tp[i] rank的辅助数组(按第二关键字排序的结果),与SA意义一样

 bool cmp(int *f, int x, int y, int w){return f[x] == f[y] && f[x + w] == f[y + w];}

 void get_SA(char *s, int n, int m)

 {

     for(int i = ; i < m; i++) sum[i] = ;

     for(int i = ; i < n; i++) sum[rank[i] = s[i]]++;

     for(int i = ; i < m; i++) sum[i] += sum[i - ];

     for(int i = n - ; i >= ; i--) SA[--sum[rank[i]]] = i;

     for(int len = ; len <= n; len <<= )

     {

         int p = ;

         for(int i = n - len; i < n; i++) tp[p++] = i;

         for(int i = ; i < n; i++)

             if(SA[i] >= len)

                 tp[p++] = SA[i] - len;

         for(int i = ; i < m; i++) sum[i] = ;

         for(int i = ; i < n; i++) sum[rank[tp[i]]]++;

         for(int i = ; i < m; i++) sum[i] += sum[i - ];

         for(int i = n - ; i >= ; i--) SA[--sum[rank[tp[i]]]] = tp[i];

         swap(rank, tp);

         p = ;

         rank[SA[]] = ;

         for(int i = ; i < n; i++)

             rank[SA[i]] = cmp(tp, SA[i - ], SA[i], len) ? p -  : p++;

         if(p >= n) break;

         m = p;

     }

     int k = ;

     n--;

     for(int i = ; i <= n; i++) rank[SA[i]] = i;

     for(int i = ; i < n; i++)

     {

         if(k) k--;

         int j = SA[rank[i] - ];

         while(s[i + k] == s[j + k]) k++;

         height[rank[i]] = k;

     }

 }

 int main()

 {

     while(~scanf("%s", str))

     {

         int len = strlen(str);

         str[len] = '';

         scanf("%s", str + len + );

         int n = strlen(str);

         str[n] = ; //末尾添加一个0

         get_SA(str, n + , 'z' + );

         int sol = ;

         for(int i = ; i < n; i++)

         {

             if(SA[i] > len && SA[i - ] < len) sol = max(sol, height[i]);

             if(SA[i] < len && SA[i - ] > len) sol = max(sol, height[i]);

         }

         printf("%d\n", sol);

     }

     return ;

 }

SAM版本：

 #include<bits/stdc++.h>

 using namespace std;

 const int kind=;

 const int maxn=;

 struct state

 {

     state *Next[kind],*link;

     int len;

     state()

     {

         link=;

         len=;

         memset(Next,,sizeof(Next));

     }

 };

 int sz;

 state st[maxn*+];

 inline state* newnode(int len = )

 {

     memset(st[sz].Next,,sizeof(st[sz].Next));

     st[sz].link=;

     st[sz].len=len;

     return &st[sz++];

 }

 state *root,*last;

 void extend(int w)

 {

     state* p=last;

     state* cur=newnode(p->len+);

     while(p&&p->Next[w]==)

     {

         p->Next[w]=cur;

         p=p->link;

     }

     if(p)

     {

         state* q=p->Next[w];

         if(p->len+==q->len)

             cur->link=q;

         else

         {

             state* clone=newnode(p->len+);

             memcpy(clone->Next,q->Next,sizeof(q->Next));

             clone->link=q->link;

             q->link=clone;

             cur->link=clone;

             while(p&&p->Next[w]==q)

             {

                 p->Next[w]=clone;

                 p=p->link;

             }

         }

     }

     else cur->link=root;

     last=cur;

 }

 string keyword;

 int main()

 {

     ios::sync_with_stdio(false);

     while(cin>>keyword)

     {

         sz=;

         int ans=;

         root=newnode();

         last=root;

         for(int i=;i<keyword.size();i++)

             extend(keyword[i]-'a');

         cin>>keyword;

         state *p=root;

         int tmp=;

         for(int i=;i<keyword.size();i++)

         {

             if(p->Next[keyword[i]-'a'])

             {

                 tmp++;

                 p=p->Next[keyword[i]-'a'];

             }

             else

             {

                 while(p&&!p->Next[keyword[i]-'a'])

                     p=p->link;

                 if(!p)

                     p=root;

                 if(p->Next[keyword[i]-'a'])

                 {

                     tmp=p->len+;

                     p=p->Next[keyword[i]-'a'];

                 }

                 else

                     tmp=;

             }

 ans=max(ans,tmp);

         }

         cout<<ans<<endl;

     }

     return ;

 }

后缀数组（SA）学习记录的更多相关文章

后缀数组SA学习笔记
什么是后缀数组后缀数组$sa[i]$表示字符串中字典序排名为$i$的后缀位置 $rk[i]$表示字符串中第$i$个后缀的字典序排名举个例子: ababa a b a b a rk: ...
后缀数组SA入门（史上最晦涩难懂的讲解）
参考资料:victorique的博客(有一点锅无伤大雅,记得看评论区),$wzz$ 课件(快去$ftp$%%%),$oi-wiki$以及某个人的帮助(万分感谢!) 首先还是要说一句:我不知道为什么我这 ...
后缀数组(SA)总结
后缀数组(SA)总结这个东西鸽了好久了,今天补一下概念后缀数组$SA$是什么东西? 它是记录一个字符串每个后缀的字典序的数组 $sa[i]$:表示排名为$i$的后缀是哪一个. \(r ...
bzoj3796(后缀数组)(SA四连)
bzoj3796Mushroom追妹纸题目描述 Mushroom最近看上了一个漂亮妹纸.他选择一种非常经典的手段来表达自己的心意——写情书.考虑到自己的表达能力,Mushroom决定不手写情书.他从 ...
[笔记]后缀数组SA
参考资料这次是真抄的: 1.后缀数组详解 2.后缀数组-学习笔记 3.后缀数组--处理字符串的有力工具定义 $SA$排名为$i$的后缀的位置 $rk$位置为$i$的后缀的排名 \(t ...
浅谈后缀数组SA
这篇博客不打算讲多么详细,网上关于后缀数组的blog比我讲的好多了,这一篇博客我是为自己加深印象写的. 给你们分享了那么多,容我自私一回吧~ 参考资料:这位dalao的blog 一.关于求Suffix ...
【字符串】后缀数组SA
后缀数组概念实际上就是将一个字符串的所有后缀按照字典序排序得到了两个数组 $sa[i]$ 和 $rk[i]$,其中 $sa[i]$ 表示排名为 i 的后缀,$rk[i]$ 表示后 ...
洛谷.3809.[模板]后缀排序(后缀数组倍增) & 学习笔记
题目链接 //输出ht见UOJ.35 #include<cstdio> #include<cstring> #include<algorithm> const in ...
后缀数组SA
复杂度:O(nlogn) 注:从0到n-1 const int maxn=1e5; char s[maxn]; int sa[maxn],Rank[maxn],height[maxn],rmq[max ...
洛谷2408不同字串个数/SPOJ 694/705 （后缀数组SA）
真是一个三倍经验好题啊. 我们来观察这个题目,首先如果直接整体计算,怕是不太好计算. 首先,我们可以将每个子串都看成一个后缀的的前缀.那我们就可以考虑一个一个后缀来计算了. 为了方便起见,我们选择按照 ...

随机推荐

HDU 1028 Ignatius and the Princess III伊格和公主III（AC代码）母函数
题意: 输入一个数n,求组合成此数字可以有多少种方法,每一方法是不记录排列顺序的.用来组成的数字可以有1.2.3....n.比如n个1组成了n,一个n也组成n.这就算两种.1=1,2=1+1=2,3= ...
hiho一下第三十九周归并排序求逆序数
题目链接:http://hihocoder.com/contest/hiho39/problem/1 ,归并排序求逆序数. 其实这道题也是可以用树状数组来做的,不过数据都比较大,所以要离散化预处理一下 ...
再次尝试windows下msys+MinGW编译ffmpeg
电脑上安装太多的开源库,环境变量里面一些常用的头文件都有几种,以前使用的编译ffmpeg的方法现在常常提示错误.从config.log中看,这些错误往往都是一些头文件引用错误导致.由于项目中继续编译自 ...
pycharm tab换为4个空格
Edit => find => replace 然后勾上 Regex,上一行输入 \t,下一行输入4个空格.
ImportError: No module named PIL
解决方法: 在C:\Python27\Scripts目录下打开命令行,输入: pip install Pillow
C/C++语言补缺宏- extern "C"-C/C++互调
1. 宏中的# 宏中的#的功能是将其后面的宏参数进行字符串化操作(Stringizing operator),简单说就是在它引用的宏变量的左右各加上一个双引号. 如定义好#define STRING( ...
python_16_自己建立模块
import python_5_password
CUDA编程时，线程块的处理方法
Java控制语句例题，for循环语句，if条件语句等，Scanner类与Random类，Math.max（）方法
例题:编写程序,生成5个1至10之间的随机整数,并打印结果到控制台 import java.util.Random;class demo09 { public static void main(Str ...
Bootstrap 按钮(Button)插件加载状态
通过按钮(Button)插件,您可以添加进一些交互.比如控制按钮的状态.或者为其它组件(工具栏)创建按钮组. 加载状态如需向按钮添加加载状态,只需要简单地向 button 元素添加 data-loa ...

后缀数组（SA）学习记录

后缀数组（SA）学习记录的更多相关文章

随机推荐

热门专题