Milk Patterns POJ - 3261 后缀数组
Farmer John has noticed that the quality of milk given by his cows varies from day to day. On further investigation, he discovered that although he can't predict the quality of milk from one day to the next, there are some regular patterns in the daily milk quality.
To perform a rigorous study, he has invented a complex classification scheme by which each milk sample is recorded as an integer between 0 and 1,000,000 inclusive, and has recorded data from a single cow over N (1 ≤ N ≤ 20,000) days. He wishes to find the longest pattern of samples which repeats identically at least K (2 ≤ K ≤ N) times. This may include overlapping patterns -- 1 2 3 2 3 2 3 1 repeats 2 3 2 3 twice, for example.
Help Farmer John by finding the longest repeating subsequence in the sequence of samples. It is guaranteed that at least one subsequence is repeated at least K times.
Input
Lines 2..
N+1:
N integers, one per line, the quality of the milk on day
i appears on the
ith line.
Output
K times
Sample Input
8 2
1
2
3
2
3
2
3
1
Sample Output
4
1 /*
2 题意:
3 给你一个长度为n的序列,你要找到重复相同至少K(2≤K≤N)次的样本的最长模式。输出最长是多少(这k次样本可以重叠一部分)
4
5 题解:
6 这道题原来我是想这先用后缀数组求出来height数组之后,然后只需要在height[i...n]这个范围内找到范围为m,使这个范围内的
7 最小值尽可能大就行
8 相当于滑动窗口,但是这个窗口的宽度是可变的(根据题目输入)
9 然后我就发现了这个问题总是在询问一个范围内的最小值,感觉可用线段树。虽然每次询问耗时使log(n),但是要询问好多次,总复杂度
10 相当于nlog(n),感觉还不行
11
12 百度一发,可以用二分枚举最后答案,然后判断一下这个答案可以不就可以了
13 怎么判断?
14 你只需要找出来height数组中连着的m-1个height值都大于你二分枚举出来那个值就行
15
16 */
17 #include <cstdlib>
18 #include <cstring>
19 #include <cstdio>
20 #include <algorithm>
21 using namespace std;
22
23 const int N = 200000+9;
24 int x[N], y[N], c[N];
25 int rank[N], height[N];
26 int sa[N],s[N],n,k;
27 bool pan(int *x,int i,int j,int k,int n)
28 {
29 int ti=i+k<n?x[i+k]:-1;
30 int tj=j+k<n?x[j+k]:-1;
31 return x[i]==x[j]&&ti==tj;
32 }
33 void build_SA(int n,int r)
34 {
35 int *x=rank,*y=height;
36 for(int i=0; i<r; i++)c[i]=0;
37 for(int i=0; i<n; i++)c[s[i]]++;
38 for(int i=1; i<r; i++)c[i]+=c[i-1];
39 for(int i=n-1; i>=0; i--)sa[--c[s[i]]]=i;
40 r=1;
41 x[sa[0]]=0;
42 for(int i=1; i<n; i++)
43 x[sa[i]]=s[sa[i]]==s[sa[i-1]]?r-1:r++;
44 for(int k=1; r<n; k<<=1)
45 {
46 int yn=0;
47 for(int i=n-k; i<n; i++)y[yn++]=i;
48 for(int i=0; i<n; i++)
49 if(sa[i]>=k)y[yn++]=sa[i]-k;
50 for(int i=0; i<r; i++)c[i]=0;
51 for(int i=0; i<n; i++)++c[x[y[i]]];
52 for(int i=1; i<r; i++)c[i]+=c[i-1];
53 for(int i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i];
54 swap(x,y);
55 r=1;
56 x[sa[0]]=0;
57 for(int i=1; i<n; i++)
58 x[sa[i]]=pan(y,sa[i],sa[i-1],k,n)?r-1:r++;
59 }
60 for(int i=0; i<n; i++)rank[i]=x[i];
61 }
62 void get_height(int n)
63 {
64 int i,j,k=0;
65 for(i=1; i<=n; i++)rank[sa[i]]=i;
66 for(i=0; i<n; i++)
67 {
68 if(k)k--;
69 else k=0;
70 j=sa[rank[i]-1];
71 while(s[i+k]==s[j+k])k++;
72 height[rank[i]]=k;
73 }
74 }
75 int check(int len)
76 {
77 int i=2,cnt=0;
78 while(1)
79 {
80 while(i<=n && height[i]>=len)
81 cnt++,i++;
82 if(cnt+1>=k)return 1;
83 if(i>=n)return 0;
84 while(i <=n &&height[i]<len)
85 i++;
86 cnt=0;
87 }
88 }
89
90 int main()
91 {
92 scanf("%d%d",&n,&k);
93 for(int i=0; i<n; i++)
94 scanf("%d",&s[i]),s[i]++;
95 s[n]=0;
96
97 build_SA(n+1,N);
98 get_height(n);
99 int l=1,r=n,ans=1,mid;
100 while(l<=r)
101 {
102 mid=(l+r)/2;
103 if(check(mid))
104 l=mid+1,ans=mid;
105 else
106 r=mid-1;
107 }
108 printf("%d\n",ans);
109 return 0;
110 }
Milk Patterns POJ - 3261 后缀数组的更多相关文章
- Milk Patterns POJ - 3261(后缀数组+二分)
题意: 求可重叠的最长重复子串,但有一个限制条件..要至少重复k次 解析: 二分枚举k,对于连续的height 如果height[i] >= k 说明它们至少有k个元素是重复的,所以判断一下就好 ...
- POJ 3261 后缀数组
题目链接:http://poj.org/problem?id=3261 题意:约翰注意到奶牛产奶的之类是不断变化的,虽然他不能预测从当天到下一天的变化情况但是他知道变化是有规律的,牛奶的质量由一个整数 ...
- poj 3261 后缀数组 找反复出现k次的子串(子串能够重叠)
题目:http://poj.org/problem?id=3261 仍然是后缀数组的典型应用----后缀数组+lcp+二分 做的蛮顺的,1A 可是大部分时间是在调试代码.由于模板的全局变量用混了,而自 ...
- poj 3261 后缀数组 可重叠的 k 次最长重复子串
Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 16430 Accepted: 7252 Ca ...
- Milk Patterns - poj 3261 (求重复k次的最长子串)
题目大意:给你一个数组,求这个数组里面至少重复k次的子串. 分析:后缀数组的练手题目...不过给的数字比较大,可以先离散化处理一下即可. 代码如下: ===================== ...
- Milk Patterns poj3261(后缀数组)
Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 9274 Accepted: 4173 Cas ...
- POJ 3261 (后缀数组 二分) Milk Patterns
这道题和UVa 12206一样,求至少重复出现k次的最长字串. 首先还是二分最长字串的长度len,然后以len为边界对height数组分段,如果有一段包含超过k个后缀则符合要求. #include & ...
- [poj 3261]后缀数组+滑窗最小值
题目链接:http://poj.org/problem?id=3261 这个是可以交叉的重复串,所以用height就可以了,但是题目说让重复k次以上,也就是直接做一个k-1长度的滑窗最小值,从这些最小 ...
- POJ 3261 后缀数组+二分
思路: 论文题- 二分+对后缀分组 这块一开始不用基数排序 会更快的(其实区别不大) //By SiriusRen #include <cstdio> #include <cstri ...
随机推荐
- 【Python】在CentOS6.8中安装pip9.0.1和setuptools33.1
wget https://bootstrap.pypa.io/ez_setup.py python ez_setup.py install --如果这个文件安装需要下载的文件无法下载的话,手动下载,放 ...
- SAP中的事务锁
我们知道sap中的事物锁tcode是SM01. 细细研究发现,其实无外乎就是将tstc表中的事务码对应的字段CINFO的值加上HEX20 解锁就是还原成原来的值. 当然也发现了,调用了一个系统函数AU ...
- 哈佛商学院MBA管理课程
课程示例:向上管理 课程 什么是向上管理? 了解自己和上司 建立合作关系 与上司进行有效沟通 管理糟糕的上司 向上管理课程内容: 全部课程目录 全部为离线文件(可有偿提供) 包括课程的全部内容,视频. ...
- pandas高级操作
pandas高级操作 import numpy as np import pandas as pd from pandas import DataFrame,Series 替换操作 替换操作可以同步作 ...
- scrapy的大文件下载(基于一种形式的管道类实现)
scrapy的大文件下载(基于一种形式的管道类实现) 爬虫类中将解析到的图片地址存储到item,将item提交给指定的管道 在管道文件中导包:from scrapy.pipelines.images ...
- Py变量,递归,作用域,匿名函数
局部变量与全局变量 全局变量:全局生效的变量,在顶头的,无缩进的定义的变量. 局部变量:函数内生效的变量,在函数内定义的变量. name='1fh' def changename(): name='s ...
- 用CSS制做一个三角形!
用CSS制做一个三角形! <style> .outer { width: 0; height: 0; border-left: 10px solid transparent; border ...
- (Sql Server)Soundex语音算法
Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字.在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做类似模糊匹配的效果. ...
- malloc函数 链表 运行时才知道内存 动态内存
https://baike.baidu.com/item/malloc函数 malloc的全称是memory allocation,中文叫动态内存分配,用于申请一块连续的指定大小的内存块区域以void ...
- java native:Java本地方法调用(jni方式)
https://www.cnblogs.com/zh1164/p/6283831.html