POJ 3261 Milk Patterns ( 后缀数组 && 出现k次最长可重叠子串长度 )

题意 : 给出一个长度为 N 的序列，再给出一个 K 要求求出出现了至少 K 次的最长可重叠子串的长度

分析 : 后缀数组套路题，思路是二分长度再对于每一个长度进行判断，判断过程就是对于 Height 数组进行限定长度的分组策略，如果有哪一组的个数 ≥ k 则说明可行！

分组要考虑到一个事实，对于每一个后缀，与其相匹配能够产生最长的LCP长度的串肯定是在后缀数组中排名与其相邻。

一开始对分组的理解有误，所以想了一个错误做法 ==>

遍历一下 Height 将值 ≥ （当前二分长度）的做一次贡献即 cnt++ ，若最后 cnt ≥ K 说明可行。当然这个肯定是炸了.......

下面说说我对于 Height 分组的理解吧，就看上面的图，如果当前 K == 2，那么第一组的含义是什么？换句话说就是为什么那么些个后缀要属于一组？可以看出第一组里面的 Height 值都不会小于 K ，实际的意义呢应当是第一组里面的有一个长度为 2 （不小于K）的共同前缀，即 “aa” ，那么是不是 “aa” 这个子串可重叠地出现了 cnt 次（cnt为第一组的后缀个数），可能你已经有点体会到分组的意义了！那么有没有可能有些前缀是 “aa” 但是没有被分进第一组呢？看见上面红字描述的事实么？根据上面的那个事实，而且 Height 的下标是根据排名有序的这个特点（有序的意思就是从小到大遍历 Height 实际传进去的下标就是排名！即 Height[i]，i是表示第 i 名的后缀），我们就知道这样的事情不会发生，且分出来的组肯定的“连续的块”，即不会有这一组的元素在其他地方的可能性！

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
;

int sa[maxn], s[maxn], wa[maxn], Ws[maxn], wv[maxn], wb[maxn];
int Rank[maxn], height[maxn];

bool cmp(int r[], int a, int b, int l){ return r[a] == r[b] && r[a+l] == r[b+l]; }
void da(int r[], int sa[], int n, int m)
{
    int i, j, p, *x = wa, *y = wb;
    ; i < m; ++i) Ws[i] = ;
    ; i < n; ++i) Ws[x[i]=r[i]]++;
    ; i < m; ++i) Ws[i] += Ws[i-];
    ; i >= ; --i) sa[--Ws[x[i]]] = i;
    , p = ; p < n; j *= , m = p)
    {
        , i = n - j; i < n; ++i) y[p++] = i;
        ; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
        ; i < n; ++i) wv[i] = x[y[i]];
        ; i < m; ++i) Ws[i] = ;
        ; i < n; ++i) Ws[wv[i]]++;
        ; i < m; ++i) Ws[i] += Ws[i-];
        ; i >= ; --i) sa[--Ws[wv[i]]] = y[i];
        , x[sa[]] = , i = ; i < n; ++i)
            x[sa[i]] = cmp(y, sa[i-], sa[i], j) ? p- : p++;
    }
}
void calheight(int r[], int sa[], int n)
{
    ;
    ; i <= n; ++i) Rank[sa[i]] = i;
    ; i < n; height[Rank[i++]] = k)
        , j = sa[Rank[i]-]; r[i+k] == r[j+k]; k++);
}

bool IsOk(int len, int n, int aim)
{
    ;
//    for(int i=2; i<=n; i++){ //错误的！
//        if(height[i] >= len)
//            if(++cnt >= aim)
//                return true;
//    }return false;
    ; i<=n; i++){
        if(height[i] >= len){ if(++cnt >= aim) return true; }
        ;
    }return false;
}

int arr[maxn];
int main(void)
{
    int N, K;
    while(~scanf("%d %d", &N, &K)){

        ; i<N; i++)
            scanf("%d", &arr[i]);

        da(arr, sa, N+, );
        calheight(arr, sa, N);

        , R = N, ans = -;
        while(L <= R){
            );
            ;
            ;
        }
        ans==-? puts(") : printf("%d\n", ans);
    }
    ;
}

题目单个元素的值能达到 1e6 这么大，数组按这个开还勉强OK，但是这里还是要学学离散化的姿势！

离散化版:

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
;
struct st{
    int ord, val;
    bool operator < (const st &rhs) const {
        return this->val < rhs.val;
    };
}arr[maxn];

int sa[maxn], s[maxn], wa[maxn], Ws[maxn], wv[maxn], wb[maxn];
int Rank[maxn], height[maxn];

bool cmp(int r[], int a, int b, int l){ return r[a] == r[b] && r[a+l] == r[b+l]; }
void da(int r[], int sa[], int n, int m)
{
    int i, j, p, *x = wa, *y = wb;
    ; i < m; ++i) Ws[i] = ;
    ; i < n; ++i) Ws[x[i]=r[i]]++;
    ; i < m; ++i) Ws[i] += Ws[i-];
    ; i >= ; --i) sa[--Ws[x[i]]] = i;
    , p = ; p < n; j *= , m = p)
    {
        , i = n - j; i < n; ++i) y[p++] = i;
        ; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
        ; i < n; ++i) wv[i] = x[y[i]];
        ; i < m; ++i) Ws[i] = ;
        ; i < n; ++i) Ws[wv[i]]++;
        ; i < m; ++i) Ws[i] += Ws[i-];
        ; i >= ; --i) sa[--Ws[wv[i]]] = y[i];
        , x[sa[]] = , i = ; i < n; ++i)
            x[sa[i]] = cmp(y, sa[i-], sa[i], j) ? p- : p++;
    }
}
void calheight(int r[], int sa[], int n)
{
    ;
    ; i <= n; ++i) Rank[sa[i]] = i;
    ; i < n; height[Rank[i++]] = k)
        , j = sa[Rank[i]-]; r[i+k] == r[j+k]; k++);
}

bool IsOk(int len, int n, int aim)
{
    ;
    ; i<=n; i++){
        if(height[i] >= len)
            { if(++cnt >= aim) return true; }
        ;
    }return false;
}

int r[maxn];
int main(void)
{
    int N, K;
    while(~scanf("%d %d", &N, &K)){
        ; i<N; i++){
            scanf("%d", &arr[i].val);
            arr[i].ord = i;
        }

        ;
        sort(arr, arr+N);
        ; i<N; i++)
             && arr[i].val == arr[i-].val) r[arr[i].ord] = num; ///注意相等的时候如何处理
            else r[arr[i].ord] = ++num;

        da(r, sa, N+, num+);
        calheight(r, sa, N);

        , R = N, ans = -;
        while(L <= R){
            );
            ;
            ;
        }
        ans==-? puts(") : printf("%d\n", ans);
    }
    ;
}

POJ 3261 Milk Patterns ( 后缀数组 && 出现k次最长可重叠子串长度 )的更多相关文章

POJ 3261 Milk Patterns 后缀数组求一个串种最长可重复子串重复至少k次
Milk Patterns Description Farmer John has noticed that the quality of milk given by his cows varie ...
Poj 3261 Milk Patterns(后缀数组+二分答案)
Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...
POJ 3261 Milk Patterns(后缀数组+单调队列)
题意找出出现k次的可重叠的最长子串的长度题解用后缀数组. 然后求出heigth数组. 跑单调队列就行了.找出每k个数中最小的数的最大值.就是个滑动窗口啊 (不知道为什么有人写二分,其实写啥都差不 ...
poj 3261 Milk Patterns 后缀数组 + 二分
题目链接题目描述给定一个字符串,求至少出现 $k$ 次的最长重复子串,这 $k$ 个子串可以重叠. 思路二分子串长度,据其将 $h$ 数组分组,判断是否存在一组其大小 \(\ge ...
POJ3261 Milk Patterns —— 后缀数组出现k次且可重叠的最长子串
题目链接:https://vjudge.net/problem/POJ-3261 Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Tot ...
POJ 3261 Milk Patterns （求可重叠的k次最长重复子串）+后缀数组模板
Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 7586 Accepted: 3448 Cas ...
POJ 3261 Milk Patterns 【后缀数组最长可重叠子串】
题目题目:http://poj.org/problem?id=3261 Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Total Subm ...
poj3261 Milk Patterns 后缀数组求可重叠的k次最长重复子串
题目链接:http://poj.org/problem?id=3261 思路: 后缀数组的很好的一道入门题目先利用模板求出sa数组和height数组然后二分答案(即对于可能出现的重复长度进行二分) ...
poj 3261 Milk Patterns（后缀数组）(k次的最长重复子串)
Milk Patterns Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 7938 Accepted: 3598 Cas ...

随机推荐

mysql下载与安装过程
1:下载MySql 官网下载地址:https://dev.mysql.com/downloads/mysql/ 选择对应的下载文件.(我电脑是64位,所以这下载的是64位的下载文件) 2:解压mysq ...
配置idea中类头注释中的 ${user} 自动获取电脑的名字，怎么去修改名字
在idea安装路径下找到 idea\IntelliJ IDEA 2018.3.2\bin下面有一个文件叫:idea64.exe.vmoptions 编辑此文件就能修改主时钟自动获取的名称: 例如:添加 ...
深入理解java：1.2. 字节码执行引擎
执行引擎是Java虚拟机的核心组成部分之一. 首先,想想C++和Java在编译和运行时到底有啥不一样? 下图左边,C++发布的就是机器指令, 而下图右边Java发布的是字节码,字节码在运行时通过JVM ...
六、Zabbix-自动分组
一.配置Zabbix server 1.创建主机组 (2)配置—>主机群组—>创建主机群组 (2)Next Step (3)可以看到新添加的主机组 2.添加自动分组动作配置—>动作 ...
centos7 安装redis 出现cc: command not found错误解决
安装过程 1. 下载并解压 cd /root/software wget http://download.redis.io/releases/redis-3.2.4.tar.gz tar -zxvf ...
virtualenvwrapper安装和使用
virtualenvwrapper安装和使用步骤: 1.安装: *nix上安装的命令: pip install virtualenvwrapper windows上安装的命令: pip install ...
js模拟自动化测试 -- 多用户登录
1.核心登录提交方法 /** * 动态表单提交方法 * @param url{string}: 提交地址 * @param params{object}: 要提交的表单数据 **/ function ...
SCUT - 161 - 灯游 - 数学
https://scut.online/p/161 很显然一个数被开关的概率是他的因子的个数的占比. 然后又很显然其实这个总的概率就是一个二项式求和. 模拟这个过程WA了8发.正常,毕竟浮点误差累积比 ...
剑指offer-包含min函数的栈-栈和队列-python
题目描述定义栈的数据结构,请在该类型中实现一个能够得到栈中所含最小元素的min函数(时间复杂度应为O(1)). # -*- coding:utf-8 -*- class Solution: de ...
git Permanently added the RSA host key for IP address '13.250.177.223' to the list of known hosts.
只要把那个ip地址添加进hosts列表中就可解决. 参见:https://blog.csdn.net/hunhun1122/article/details/79752125

POJ 3261 Milk Patterns ( 后缀数组 && 出现k次最长可重叠子串长度 )

POJ 3261 Milk Patterns ( 后缀数组 && 出现k次最长可重叠子串长度 )的更多相关文章

随机推荐

热门专题