【spoj705】 Distinct Substrings

【题目描述】

给定一个字符串，计算其不同的子串个数。

【输入格式】

一行一个仅包含大写字母的字符串，长度<=50000

【输出格式】

一行一个正整数，即不同的子串个数。

【样例输入】

ABABA

【样例输出】

9

【思路】
　　一看就知道是后缀数组题啦～但是我不会写QAQ。。只好现学现用啦～
　　在字符串最后补上一个'$',不因为别的只因为它比‘A’还要小。。不然你补ascII码是0的也可以。。
　　申请rank数组和sa数组，rank[i]=j代表后缀i排第j位，sa[i]=j代表排名第i的是后缀j。也就是说rank和sa是相反的运算。
　　首先将sa数组按照单字母的顺序排个序，更新rank数组，不过记得字母相同的排名也要相同，也就是如果str[sa[i]]==str[sa[i-1]]的话rank[sa[i]]=rank[sa[i-1]];else rank[sa[i]]=rank[sa[i-1]]+1;
　　然后将k从0开始枚举，每次继续对sa进行排序，但是是以rank[sa[i]]为第一关键字，rank[sa[i]+2^k]为第二关键字排序。
　　在Trank中（其实就是tmpRank）更新好新的rank值，一样记得如果rank[sa[i]]==rank[sa[i-1]]&&rank[sa[i]+2^k]==rank[sa[i-1]+2^k]的话排名不要上升。
　　重复这一步，直到2^k>=n或者所有后缀的排名都不同。
　　然后正常情况下k增加logN次，每次如果用计数排序只要O(N),一共O(NlogN)。
　　但是不会写计数排序啊QAQ。。所以用快排好了。。多加一个log，一般不会被卡的吧。。
　　计算出来sa和rank之后还要计算height数组，height[i]代表sa[i]和sa[i-1]的最长公共前缀，如果按照1——n的顺序计算的话是O(N²)的，显然不够优秀，于是我们按照一种奇怪的顺序计算。
　　先算height[rank[1]]，然后是height[rank[2]]……
　　这样的话就会有一个性质：height[rank[i]]>=height[rank[i-1]]-1
　　我也不知道为什么但是就是这样的。。
　　然后就没有然后了。。
　　我们知道任何一个子串都是某一个后缀的一个前缀
　　对于后缀i来说，有length-i个前缀，其中有height[i]个和前一个后缀相同
　　所以答案就是Σlength-i-height[i]

 #include <iostream>

 #include <cstring>

 #include <string>

 #include <cstdio>

 #include <cstdlib>

 #include <cmath>

 #include <algorithm>

 #include <queue>

 #include <stack>

 #include <map>

 #include <set>

 #include <list>

 #include <vector>

 #include <ctime>

 #include <functional>

 #define pritnf printf

 #define scafn scanf

 #define sacnf scanf

 #define For(i,j,k) for(int i=(j);i<=(k);(i)++)

 #define Clear(a) memset(a,0,sizeof(a))

 using namespace std;

 typedef unsigned int Uint;

 const int INF=0x3fffffff;

 const double eps=1e-;

 ///==============struct declaration==============

 ///==============var declaration=================

 const int MAXN=;

 int n,k;

 int sa[MAXN],rank[MAXN],h[MAXN],trank[MAXN],height[MAXN];

 char str[MAXN];

 ///==============function declaration============

 bool cmp(int a,int b){return rank[a]==rank[b]?rank[a+(<<k)]<rank[b+(<<k)]:rank[a]<rank[b];}

 bool cmp1(int a,int b){return str[a]<str[b];}

 ///==============main code=======================

 int main()

 {

     scanf("%s",str+);

     n=strlen(str+);str[n+]='$';n++;

     for(int i=;i<=n;i++)

         sa[i]=i;

     sort(sa+,sa++n,cmp1);

     rank[sa[]]=;

     for(int i=;i<=n;i++)

         if (str[sa[i]]!=str[sa[i-]])

             rank[sa[i]]=rank[sa[i-]]+;

         else

             rank[sa[i]]=rank[sa[i-]];

     for(k=;(<<k)<=n;k++){

         sort(sa+,sa++n,cmp);

         trank[sa[]]=;

         for(int i=;i<=n;i++){

             if (rank[sa[i]]!=rank[sa[i-]]||rank[sa[i]+(<<k)]!=rank[sa[i-]+(<<k)])

                 trank[sa[i]]=trank[sa[i-]]+;

             else

                 trank[sa[i]]=trank[sa[i-]];

         }

         for(int i=;i<=n;i++)

             rank[i]=trank[i];

         if (rank[sa[n]]==n) break;

     }

     for(int i=;i<=n;i++)

         rank[sa[i]]=i;

     ///height[i]表示sa[rank[i]]和sa[rank[i-1]]的最长前缀

     height[rank[]]=;

     for(int i=;i<=n;i++){

         height[rank[i]]=max(height[rank[i-]]-,);

         int p=i,q=sa[rank[i]-];

         while (str[p+height[rank[i]]]==str[q+height[rank[i]]])

             height[rank[i]]++;

     }

     long long ans=;

     for(int i=;i<=n;i++)

         ans+=n-sa[i]-height[i];

       printf("%lld\n",ans);

    return ;

 }

 ///================fuction code====================

Spoj 705

　　　尽量多做后缀数组的题目吧，熟能生巧，现在只是刚刚学会了后缀数组，还要多多加油才是。

【spoj705】 Distinct Substrings的更多相关文章

【SPOJ】Distinct Substrings（后缀自动机）
[SPOJ]Distinct Substrings(后缀自动机) 题面 Vjudge 题意:求一个串的不同子串的数量题解对于这个串构建后缀自动机之后我们知道每个串出现的次数就是\(right/e ...
【SPOJ】Distinct Substrings/New Distinct Substrings（后缀数组）
[SPOJ]Distinct Substrings/New Distinct Substrings(后缀数组) 题面 Vjudge1 Vjudge2 题解要求的是串的不同的子串个数两道一模一样的题 ...
【SPOJ】Distinct Substrings
[SPOJ]Distinct Substrings 求不同子串数量统计每个点有效的字符串数量(第一次出现的) \(\sum\limits_{now=1}^{nod}now.longest-paren ...
【SPOJ694】Distinct Substrings （SA）
求不相同子串个数该问题等价于求所有后缀间不相同前缀的个数..也就是对于每个后缀suffix(sa[i]),将贡献出n-sa[i]+1个,但同时,要减去那些重复的,即为height[i],故答案 ...
【CF316G3】Good Substrings 后缀自动机
[CF316G3]Good Substrings 题意:给出n个限制(p,l,r),我们称一个字符串满足一个限制当且仅当这个字符串在p中的出现次数在[l,r]之间.现在想问你S的所有本质不同的子串中, ...
【SPOJ 694】Distinct Substrings (更直接的求法)
[链接]h在这里写链接 [题意] 接上一篇文章 [题解] 一个字符串所有不同的子串的个数=∑(len-sa[i]-height[i]) [错的次数] 0 [反思] 在这了写反思 [代码] #inclu ...
【SPOJ 694】Distinct Substrings
[链接]h在这里写链接 [题意] 给你一个长度最多为1000的字符串让你求出一个数x,这个x=这个字符串的不同子串个数; [题解] 后缀数组题. 把原串复制一份,加在 ...
【UVA10829】 L-Gap Substrings （后缀数组）
Description If a string is in the form UVU, where U is not empty, and V has exactly L characters, we ...
【POJ3415】 Common Substrings（后缀数组|SAM）
Common Substrings Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤ ...

随机推荐

jquery-leonaScroll-1.3-自定义竖向自适应滚动条插件
下载链接地址:https://share.weiyun.com/9ac3ca3fb29648bb1aad1b83a76b123c (密码:4y9t)[含mini版] 欢迎使用leonaScroll-1 ...
51Nod 1268 和为K的组合
51Nod 1268 和为K的组合 1268 和为K的组合基准时间限制:1 秒空间限制:131072 KB 分值: 20 难度:3级算法题给出N个正整数组成的数组A,求能否从中选出若干个,使 ...
string常用函数
1.addslashes($str); //转义时str中的所有特殊字符 stripslashes($str) //还原 2.bin2hex($str); //将2进制转成16进制 3. echo c ...
Newtonsoft.Json 序列化和反序列化时间格式【转】
1.JSON序列化 string JsonStr= JsonConvert.SerializeObject(Entity); eg: A a=new A(); a.Name="Elain ...
调戏OpenShift：一个免费能干的云平台
一.前因后果以前为了搞微信的公众号,在新浪sae那里申请了一个服务器,一开始还挺好的 ,有免费的云豆送,但是一直运行应用也要消费云豆,搞得云豆也所剩无几了.作为一名屌丝,日常吃土,就单纯想玩一玩微信 ...
angular服务二
angular服务 $http 实现客户端与服务器端异步请求 get方式 test.html <!DOCTYPE html> <html lang="en"> ...
Python学习总结 01 配置环境
1 查看python的版本 ubuntu16.04 LTS系统下默认安装了python2.7.12 和python3.5.2, 她们在/usr/bin/下可以找到, 默认用python2.7.8 1) ...
ios相同版本升级
公司新发布ios,因为各种错误以及审核不通过造成app未能上传,而app在提交的时候不能上传相同的版本号,造成app还没有正式的上传上传已经将版本号升级到1.0.6 解决方法: 在Xcode上,查看项 ...
BZOJ1492: [NOI2007]货币兑换Cash
设$x_j$,$y_j$为第$j$天能买的A,B券数量,$f_i$为第$i$天的最大收益.$f_i=\max_{1\le j<i}a_ix_j+b_iy_j$,最大化$f_i$即找一个点$(x_ ...
UUID库
If you cannot afford to use Boost, then there is a very minimal library that I implemented which sim ...

【spoj705】 Distinct Substrings

【题目描述】

【输入格式】

【输出格式】

【样例输入】

【样例输出】

【spoj705】 Distinct Substrings的更多相关文章

随机推荐

热门专题