题目描述

将字符串 \(T\) 拆成若干个子串,使这些子串为字符串 \(S\) 的前缀,要求拆分形成的子串数最小。

思路整理

实际上并不需要倒着枚举,也不需要线段树,更不需要 Z 函数。

如果你做过 P3002 恐吓信 这道题,不难发现他们之间的相似之处。

首先我们容易想到一个 \(O(n^2)\) 的暴力 dp 。令 \(f[i]\) 为切完前 \(i\) 个字符形成的最小子串,则可以列出下列转移方程:

\[f[i] = min(f[i-j]) + 1(0<=j<=min(|T|,i)\; and \; T(1 \sim j) == S[(i-j+1) \sim i])
\]

转移方程的实际含义就是枚举最后一刀应该砍在哪里,才能使最后一个子串为 \(T\) 的前缀,很简洁,我们尝试优化她。

首先方程的枚举只用于求最小的满足条件的 \(f[j]\) 。这很浪费。我们可以输出 \(f\) 数组进行观察,然后可以发现 \(f\) 数组单调递增。

证明一下:因为 \(S[1 \sim (i-1)]\) 是 \(S[1 \sim i]\) 的前缀,所以必然有这么长一种策略:在找到 \(S[1 \sim i]\) 的最后一个 \(T\) 的前缀时,将前缀的最后一个字母去除,就变成了\(S[1 \sim (i-1)]\) 的最后一个 \(T\) 的前缀。因此 \(f[i-1] <= f[i]\) 。

这样,我们的任务就变成了:寻找最小的满足条件的 \(j\) 。

在 P3002 中,我们的任务与这题类似。只不过 \(T\) 的所有子串都可作为魔法词缀。所以,在那题里,我们使用了后缀数组进行优化。

回到这题, 模拟一下找最远位置的步骤,发现我们要找的是最大的数 \(i\) 使 \(T\) 的长度为 \(i\) 前缀与 \(S\) 长度为 \(i\) 的后缀相等。

不如把这个问题视作将 \(T\) 在 \(S\) 上匹配。将 \(T\) 从第一位开始一位一位跟 \(S\) 的最后的字符匹配,这时我们可以发现这就是模拟了 KMP 文本串匹配模式串的过程。

从反方向理解一下:当 KMP 匹配到第 \(i\) 位时,指针 \(j\) 表示模式串匹配到前 \(j\) 位了。而与之匹配的就是文本串的后缀。

于是我们可以用 KMP 优化,在匹配途中记录下每个 \(i\) 对应的指针 \(j\) 作为能匹配的最大前缀,转移时只需要从这个转移即可。时间复杂度 \(O(|T|+|S|)\) ,瓶颈在 KMP。

代码讲解

#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int maxn = 1e7 + 5;
int n, m;
string T, S;
int dp[maxn], qian[maxn], f[maxn];
void kmp()
{
int j=0;
for(int i=2;i<=n;i++){
while(j&&T[j+1]!=T[i]) j=qian[j];
if(T[j+1]==T[i]) j++;
qian[i]=j;
}
j=0;
for(int i=1;i<=m;i++){
while(j&&T[j+1]!=S[i]) j=qian[j];
if(T[j+1]==S[i]) j++;
f[i] = j;
}
}
int main()
{
std::ios::sync_with_stdio(false);
cin.tie(0);
cout.tie(0);
cin >> n >> m;
cin >> T >> S;
T = ' ' + T;
S = ' ' + S;
for(int i = 1;i <= m;i ++) dp[i] = 19198100;
dp[0] = 0;
kmp();
for(int i = 1;i <= m;i ++)
{
dp[i] = min(dp[i], dp[i - f[i]] + 1);
}
if(dp[m] == 1919810) cout << "Fake" << endl;
else cout << dp[m] << endl;
return 0;
}

后记

本来不写题解不觉得,一写题解发现很多细节做题时并没有考虑清楚,例如单调性的证明做题时是通过打表得出的。这也证明了写题解和解题报告也是做题提升的重要一环。

P8112 符文破译的更多相关文章

  1. 长理ACM 7-密码破译(闫博钊)

    /* //题目标题: *密码破译(闫博钊) //题目描述: *某组织欲破获一个外星人的密码,密码由一定长度的字串组成.此组织拥有一些破译此密码的长度不同的钥匙,若两个钥匙的长度之和恰好为此密码的长度, ...

  2. 黑客破译android开发代码真就那么简单?

    很多程序员辛辛苦苦开发出的android开发代码,很容易就被黑客翻译了. Google似乎也发现了这个问题,从SDK2.3开始我们可以看到在android-sdk-windows\tools\下面多了 ...

  3. android 开发代码被黑客破译有那么容易吗?

    很多程序员辛辛苦苦开发出的android开发代码,很容易就被黑客翻译了. Google似乎也发现了这个问题,从SDK2.3开始我们可以看到在android-sdk-windows\tools\下面多了 ...

  4. NLP系列(1)_从破译外星人文字浅谈自然语言处理基础

    作者:龙心尘 &&寒小阳 时间:2016年1月. 出处: http://blog.csdn.net/longxinchen_ml/article/details/50543337 ht ...

  5. LOL新版符文 怎么查看队友的符文配置?

    LOL怎么看其他玩家符文? 像我这种名字都懒的打的, 直接去WeGame复制昵称. 然后在LOL主界面点生涯, 之后搜索 光头强xian生

  6. webstorm 2017.1 破译

    安装完webstorm后, 在弹出的注册窗口选择 activate > license server > 在 License server address 里输入 "http:/ ...

  7. [Bzoj5043][Lydsy1709月赛]密码破译(按位dp)

    5043: [Lydsy1709月赛]密码破译 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 477  Solved: 125[Submit][Sta ...

  8. NLP系列(1)_从破译外星人文字浅谈自然语言处理的基础

    作者:龙心尘 &&寒小阳 时间:2016年1月. 出处: http://blog.csdn.net/longxinchen_ml/article/details/50543337, h ...

  9. 【t098】符文之语

    Time Limit: 1 second Memory Limit: 128 MB [问题描述] 当小FF来到神庙时,神庙已经破败不堪了.但神庙的中央有一个光亮如新的石台.小FF走进石台, 发现石台上 ...

  10. i春秋破译

    点开题目就是一段密文 TW5650Y - 0TS UZ50S S0V LZW UZ50WKW 9505KL4G 1X WVMUSL510 S001M0UWV 910VSG S0 WFLW0K510 1 ...

随机推荐

  1. MySQL系列-详解mysql数据类型

    MySQL数据类型 (1)数值类型 1.整数型 2.浮点型 3.定点型 (2)日期时间类型 (3)字符串类型 MySQL字段属性 1.空\不为空值:NULL.NOT NULL 2.主键:primary ...

  2. 关于Docker容器内不能ping通外网

    先在主机重启docker服务 systemctl stop docker systemctl start docker 然后再开启容器,进入容器 https://blog.csdn.net/qq_42 ...

  3. 2020-2021第一学期2024"DCDD"小组第十一周讨论

    2020-2021第一学期"DCDD"第十一周讨论 小组名称:DCDD 小组成员:20202403孟凡斌.20202411陈书桓.20202416刘铭睿.20202420黄椿淇 照 ...

  4. HTML复习(17.表格样式)

    重点 掌握caption-side(表格标题位置) 掌握border-collapse(表格边框合并) 掌握border-spacing(表格边框间距) 表格标题位置在CSS中,我们可以使用capti ...

  5. Apple Sources

    1. libsystem_malloc.dylib的源码 https://opensource.apple.com/tarballs/libmalloc/ .这里有多个版本(例如用otool找到iOS ...

  6. JS通用公共函数

    function formatTime(time) { if (typeof time !== 'number' || time < 0) { return time } var hour = ...

  7. python中json的四个方法总结dumps、dump、loads、load

    json的四个方法总结dumps.dump.loads.load dump介绍 1 json .作用:将python内置类型序列化为json对象后写入文件.参数:要存储的数据以及可以用于存储的文件对象 ...

  8. 【APT】Patchwork APT组织针对巴基斯坦国防官员攻击活动分析

    前言 Patchwork(白象.摩诃草.APT-C-09.Dropping Elephant)是一个疑似具有印度国家背景的APT组织,该组织长期针对中国.巴基斯坦等南亚地区国家进行网络攻击窃密活动.本 ...

  9. Linux磁盘相关工具 -- iostat

    iostat主要用于监控系统设备的IO负载情况,根据这个可以看出当前系统的写入量和读取量,CPU负载和磁盘负载. iostat主要用于输出磁盘IO和CPU统计信息. 1. iostat用法: iost ...

  10. HTML悬浮div

    需求,html底部为地图,上层是各个div HTML<body> //地图 <div id='map' id="demo1"></div> &l ...