【题目描述】

给定一个字符串,计算其不同的子串个数。

【输入格式】

一行一个仅包含大写字母的字符串,长度<=50000

【输出格式】

一行一个正整数,即不同的子串个数。

【样例输入】

ABABA

【样例输出】

9

【思路】
  一看就知道是后缀数组题啦~但是我不会写QAQ。。只好现学现用啦~
  在字符串最后补上一个'$',不因为别的只因为它比‘A’还要小。。不然你补ascII码是0的也可以。。
  申请rank数组和sa数组,rank[i]=j代表后缀i排第j位,sa[i]=j代表排名第i的是后缀j。也就是说rank和sa是相反的运算。
  首先将sa数组按照单字母的顺序排个序,更新rank数组,不过记得字母相同的排名也要相同,也就是如果str[sa[i]]==str[sa[i-1]]的话rank[sa[i]]=rank[sa[i-1]];else rank[sa[i]]=rank[sa[i-1]]+1;
  
然后将k从0开始枚举,每次继续对sa进行排序,但是是以rank[sa[i]]为第一关键字,rank[sa[i]+2k]为第二关键字排序。
  在Trank中(其实就是tmpRank)更新好新的rank值,一样记得如果rank[sa[i]]==rank[sa[i-1]]&&rank[sa[i]+2k]==rank[sa[i-1]+2k]的话排名不要上升。
  重复这一步,直到2k>=n或者所有后缀的排名都不同。
  然后正常情况下k增加logN次,每次如果用计数排序只要O(N),一共O(NlogN)。
  但是不会写计数排序啊QAQ。。所以用快排好了。。多加一个log,一般不会被卡的吧。。
  计算出来sa和rank之后还要计算height数组,height[i]代表sa[i]和sa[i-1]的最长公共前缀,如果按照1——n的顺序计算的话是O(N2)的,显然不够优秀,于是我们按照一种奇怪的顺序计算。
  先算height[rank[1]],然后是height[rank[2]]……
  这样的话就会有一个性质:height[rank[i]]>=height[rank[i-1]]-1
  我也不知道为什么但是就是这样的。。
  然后就没有然后了。。
  我们知道任何一个子串都是某一个后缀的一个前缀
  对于后缀i来说,有length-i个前缀,其中有height[i]个和前一个后缀相同
  所以答案就是Σlength-i-height[i]
 #include <iostream>
#include <cstring>
#include <string>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <algorithm>
#include <queue>
#include <stack>
#include <map>
#include <set>
#include <list>
#include <vector>
#include <ctime>
#include <functional>
#define pritnf printf
#define scafn scanf
#define sacnf scanf
#define For(i,j,k) for(int i=(j);i<=(k);(i)++)
#define Clear(a) memset(a,0,sizeof(a))
using namespace std;
typedef unsigned int Uint;
const int INF=0x3fffffff;
const double eps=1e-;
///==============struct declaration============== ///==============var declaration=================
const int MAXN=;
int n,k;
int sa[MAXN],rank[MAXN],h[MAXN],trank[MAXN],height[MAXN];
char str[MAXN];
///==============function declaration============
bool cmp(int a,int b){return rank[a]==rank[b]?rank[a+(<<k)]<rank[b+(<<k)]:rank[a]<rank[b];}
bool cmp1(int a,int b){return str[a]<str[b];}
///==============main code=======================
int main()
{
scanf("%s",str+);
n=strlen(str+);str[n+]='$';n++;
for(int i=;i<=n;i++)
sa[i]=i;
sort(sa+,sa++n,cmp1);
rank[sa[]]=;
for(int i=;i<=n;i++)
if (str[sa[i]]!=str[sa[i-]])
rank[sa[i]]=rank[sa[i-]]+;
else
rank[sa[i]]=rank[sa[i-]];
for(k=;(<<k)<=n;k++){
sort(sa+,sa++n,cmp);
trank[sa[]]=;
for(int i=;i<=n;i++){
if (rank[sa[i]]!=rank[sa[i-]]||rank[sa[i]+(<<k)]!=rank[sa[i-]+(<<k)])
trank[sa[i]]=trank[sa[i-]]+;
else
trank[sa[i]]=trank[sa[i-]];
}
for(int i=;i<=n;i++)
rank[i]=trank[i];
if (rank[sa[n]]==n) break;
}
for(int i=;i<=n;i++)
rank[sa[i]]=i;
///height[i]表示sa[rank[i]]和sa[rank[i-1]]的最长前缀
height[rank[]]=;
for(int i=;i<=n;i++){
height[rank[i]]=max(height[rank[i-]]-,);
int p=i,q=sa[rank[i]-];
while (str[p+height[rank[i]]]==str[q+height[rank[i]]])
height[rank[i]]++;
}
long long ans=;
for(int i=;i<=n;i++)
ans+=n-sa[i]-height[i];
printf("%lld\n",ans);
return ;
}
///================fuction code====================

Spoj 705

   尽量多做后缀数组的题目吧,熟能生巧,现在只是刚刚学会了后缀数组,还要多多加油才是。

 

【spoj705】 Distinct Substrings的更多相关文章

  1. 【SPOJ】Distinct Substrings(后缀自动机)

    [SPOJ]Distinct Substrings(后缀自动机) 题面 Vjudge 题意:求一个串的不同子串的数量 题解 对于这个串构建后缀自动机之后 我们知道每个串出现的次数就是\(right/e ...

  2. 【SPOJ】Distinct Substrings/New Distinct Substrings(后缀数组)

    [SPOJ]Distinct Substrings/New Distinct Substrings(后缀数组) 题面 Vjudge1 Vjudge2 题解 要求的是串的不同的子串个数 两道一模一样的题 ...

  3. 【SPOJ】Distinct Substrings

    [SPOJ]Distinct Substrings 求不同子串数量 统计每个点有效的字符串数量(第一次出现的) \(\sum\limits_{now=1}^{nod}now.longest-paren ...

  4. 【SPOJ694】Distinct Substrings (SA)

    求不相同子串个数    该问题等价于求所有后缀间不相同前缀的个数..也就是对于每个后缀suffix(sa[i]),将贡献出n-sa[i]+1个,但同时,要减去那些重复的,即为height[i],故答案 ...

  5. 【CF316G3】Good Substrings 后缀自动机

    [CF316G3]Good Substrings 题意:给出n个限制(p,l,r),我们称一个字符串满足一个限制当且仅当这个字符串在p中的出现次数在[l,r]之间.现在想问你S的所有本质不同的子串中, ...

  6. 【SPOJ 694】Distinct Substrings (更直接的求法)

    [链接]h在这里写链接 [题意] 接上一篇文章 [题解] 一个字符串所有不同的子串的个数=∑(len-sa[i]-height[i]) [错的次数] 0 [反思] 在这了写反思 [代码] #inclu ...

  7. 【SPOJ 694】Distinct Substrings

    [链接]h在这里写链接 [题意]     给你一个长度最多为1000的字符串     让你求出一个数x,这个x=这个字符串的不同子串个数; [题解]     后缀数组题.     把原串复制一份,加在 ...

  8. 【UVA10829】 L-Gap Substrings (后缀数组)

    Description If a string is in the form UVU, where U is not empty, and V has exactly L characters, we ...

  9. 【POJ3415】 Common Substrings(后缀数组|SAM)

    Common Substrings Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤ ...

随机推荐

  1. Webwork 学习之路【08】结合实战简析Controller 配置

    虽然现在 MVC 框架层出不穷,但做为 Struts 前身的 webwork. 其经典程度不亚于贝利之于足球,双 11 之于淘宝特卖. 本篇将结合 webwork controller 配置文件 xw ...

  2. Docker安装CentOS

    系统环境: 腾讯云公共镜像 CoreOS 7.1 X64 #docker 下载centos镜像docker  pull   centos   #下载centos所有的镜像docker  pull   ...

  3. 0103MySQL中的B-tree索引 USINGWHERE和USING INDEX同时出现

    转自博客http://www.amogoo.com/article/4 前提1,为了与时俱进,文中数据库环境为MySQL5.6版本2,为了通用,更为了避免造数据的痛苦,文中所涉及表.数据,均来自于My ...

  4. Android样式和主题

    样式:style--> 主题:theme--> <style name="my_style"> <item name="android:te ...

  5. 3d图片切换(css3帧动画)

    效果带抖动翻转隐藏,使用帧动画 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"&g ...

  6. secureCRT

    配色方案 1

  7. 我的博客CSS

    这个是按照custom标准模板来做的,博客园已经有模版了,有些细节不是很好,这个是源CSS,喜欢的可以自由DIY,完善更好. @charset "utf-8"; /* CSS Do ...

  8. java面向对象---成员变量和成员函数

    //成员变量 1.类定义了对象中所具有的变量,这些变量称作成员变量 2.每个对象都有自己的变量,和同一个类的其他对象的分开的 //函数与成员变量 1.在函数中可以直接写成员变量的名字来访问成员变量,那 ...

  9. 基于Swiper 2.7.6实现的带缩略图功能的轮播图

    非原创,只能适合PC端,如果是移动端,只需要修改界面的大小即可.界面如下: 链接:http://pan.baidu.com/s/1pK9XdUV 密码:jsyk

  10. 使用hexo,如果换了电脑怎么更新博客?

    自己今天想到这个问题,于是去知乎搜索了一番,发现不甚理想.没找到合适的,题目就是知乎原题.只好自己解决了.以下直接把自己的答案粘贴过来 今天我突然想到这个问题,想来参考参考,却发现都不太适合我.首先, ...