[算法模版]子序列DP

如何求本质不同子序列个数?

朴素DP

复杂度为\(O(nq)\)。其中\(q\)为字符集大小。

\(dp[i]\)代表以第\(i\)个数结尾的本质不同子序列个数。注意,这里对于每一个字符,只计算上一个相同字符带来的贡献。如果全部计算的话会算重复。

最后统计答案的时候也只统计每个字符最后一次出现的位置的答案。

例题:【线上训练13】子序列 中的50分部分分

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
const int maxn=2e6+100,mod=998244353;
typedef long long ll;
char s[2][maxn],ori[maxn];
int n,len=1;
int last[30];
ll dp[maxn];
void init() {
scanf("%s",ori+1);
s[1][1]=ori[1];
for(int i=2;i<=n;i++) {
int md=i&1;
for(int j=1;j<=len;j++) {
s[md][2*j-1]=ori[i];
s[md][2*j]=s[md^1][j];
}
s[md][2*len+1]=ori[i];
len=2*len+1;
}
}
int main() {
scanf("%d",&n);
init();
scanf("%s",s[n&1]+1);len=strlen(s[n&1]+1);
for(int i=1;i<=len;i++) {
int ty=s[n&1][i]-'a';
dp[i]=1;
for(int j=0;j<26;j++) {
if(last[j]){
dp[i]+=dp[last[j]];
}
}
dp[i]%=mod;
last[ty]=i;
}
ll ans=0;
for(int i=0;i<26;i++) {
if(last[i])ans+=dp[last[i]];
ans%=mod;
}
ans%=mod;
printf("%lld",ans);
}

优化DP

我们令\(f[i]=\sum_{j=1}^q dp[last[c[j]]]\)。其中\(q\)为字符集大小,\(c\)字符集。

转移的时候有两种情况:

  1. 当前字符未出现过(第一个)。那么令\(dp[i]=f[i-1]+1\),则\(f[i]=2\times f[i-1]+1\)。
  2. 当前字符在原来出现过。那么令\(dp[i]=f[i-1]+1\)。因为只记录最后一次,所以在给\(f\)加上这一次的\(dp\)值之后还要删去上一次的\(dp\)值。\(f[i]=2\times f[i-1]-dp[last[i]]+1\)。因为\(dp[last[i]]=f[last[i]-1]+1\),所以\(f[i]=2\times f[i-1]-f[last[i]-1]\)

其实本质就是利用子序列DP每次增加的都是\(\sum dp[每一个字符]\)这个特性,每次转移将\(\sum dp[每一个字符]\)用\(O(1)\)复杂度起来,做到\(O(1)\)的转移。

算法复杂度\(O(n)\)

例题:FZU-2129

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
using namespace std;
int n,a[1000500],f[1000500],last[1000500],ans=0;
const int mod=1e9+7;
int main() {
ios::sync_with_stdio(0);
while(cin>>n) {
for(int i=1;i<=n;i++)cin>>a[i];ans=0;
memset(f,0,sizeof(f));memset(last,0,sizeof(last));
for(int i=1;i<=n;i++) {
if(!last[a[i]])f[i]=(2ll*f[i-1]+1)%mod;
else f[i]=(2ll*f[i-1]-f[last[a[i]]-1])%mod;
last[a[i]]=i;
}
ans=(f[n]%mod+mod)%mod;
cout<<ans<<endl;
}
return 0;
}

矩阵优化

我们可以发现,朴素DP的DP状态可以写成矩阵形式:

\[\begin{bmatrix}dp[i][a]
\\ dp[i][b]
\\ dp[i][c]
\\ ...
\\ ...
\\ ...
\\ dp[i][z]
\\1
\end{bmatrix}
\]

这里我们为了方便的进行矩阵转移添加了一维,\(dp[i][c]\)指对于前\(i\)个字符,最后一个字符是\(c\)的子序列个数。

那么字符串第\(i\)位的字符\(s[i]\)的状态可以这样转移:\(dp[i][s[i]]=\sum dp[i-1][任意字符]+1\)。

其他情况这样转移:\(dp[i][c]=dp[i-1][c]\)

我们发现这样的转移是可以构造出转移矩阵的。那么对于字符"c"的转移矩阵应该是这样的:

\[\begin{bmatrix}
1&0 &0 &0 &0 &0 &0 &0\\
0&1 &0 &0 &0 &0 &0 &0\\
1&1 &1 &1 &1 &1 &1 &1\\
0&0 &0 &1 &0 &0 &0 &0\\
0&0 &0 &0 &1 &0 &0 &0\\
0&0 &0 &0 &0 &1 &0 &0\\
&&&...\\
0&0 &0 &0 &0 &0 &0 &1
\end{bmatrix}
\]

就是在单位矩阵上,将字符"c"对应的那一行(第三行)全部设置为1。

转移矩阵的最后一列比较特殊,我们使用最后一列来达到“+1”的效果。


构造出每个字符对应的转移矩阵后。我们每次只需要把状态矩阵乘上第\(i\)个字符\(s[i]\)的转移矩阵,就能得到新的转移矩阵。

普通情况下的合并子序列状态

上面这个矩阵最主要的作用就是拿来合并两个字符串的子序列状态。因为一个子序列状态是一个状态矩阵乘上所有转移矩阵的乘积。所以如果我们分别知道字符串\(s\)和\(t\)的转移矩阵乘积,我们就能轻松的得出\(st\)的转移矩阵乘积,从而得到字符串\(st\)的本质不同子序列个数。

但是这样显然是亏本的。一次合并的复杂度为\(O(len\times q^3)\)。其中\(q\)为字符集大小。直接\(O(n)\)DP一次不知道比它高到哪里去了。

特殊情况下的合并子序列状态

但是这种矩阵合并还是有一些用处的。当新的序列出现某种规律时(例如新串=旧串*2),我们就可以“重复使用”这个矩阵。显然是赚了的。

[算法模版]子序列DP的更多相关文章

  1. 网络流之最大流Dinic算法模版

    /* 网络流之最大流Dinic算法模版 */ #include <cstring> #include <cstdio> #include <queue> using ...

  2. HDU 1231.最大连续子序列-dp+位置标记

    最大连续子序列 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Sub ...

  3. [算法模版]Tarjan爷爷的几种图论算法

    [算法模版]Tarjan爷爷的几种图论算法 前言 Tarjan爷爷发明了很多图论算法,这些图论算法有很多相似之处(其中一个就是我都不会).这里会对这三种算法进行简单介绍. 定义 强连通(strongl ...

  4. [算法模版]Prim-完全图最小生成树

    [算法模版]Prim-完全图最小生成树 众所周知,对于常用的Kruskal算法,算法复杂度为\(O(m \log m)\).这在大多数场景下已经够用了.但是如果遇到及其稠密的完全图,Prim算法就能更 ...

  5. [算法模板]SOS DP

    [算法模板]SOS DP 正文 SOS-DP(\(\text{Sum over Subsets}\))是用来解决这样的问题的: 其实就是子集和DP.上面每个\(F[mask]\)里面包含了\(mask ...

  6. [算法模版]AC自动机

    [算法模版]AC自动机 基础内容 板子不再赘述,OI-WIKI有详细讲解. \(query\)函数则是遍历文本串的所有位置,在文本串的每个位置都沿着\(fail\)跳到根,将沿途所有元素答案++.意义 ...

  7. [算法模版]Link-Cut-Tree

    [算法模版]Link-Cut-Tree 博主懒本博客只对现有博客进行补充,先直接放隔壁链接. FlashHu-LCT总结 Menci-LCT学习笔记 make-root操作 make-root操作用于 ...

  8. 模版 动态 dp

    模版 动态 dp 终于来写这个东西了.. LG 模版:给定 n 个点的数,点有点权, $ m $ 次修改点权,求修改完后这个树的最大独立集大小. 我们先来考虑朴素的最大独立集的 dp \[dp[u][ ...

  9. 算法练习之DP 求LCM (最长公共子序列)

    1. 对于序列x[1,i]和y[1,j],推导递推公式1.a 假设当前元素同样,那么就将当前最大同样数+12.b 假设当前元素不同.那么就把当前最大同样数"传递"下去 因此递推公式 ...

随机推荐

  1. Linux下修改Mysql密码的三种方式

    前言 有时我们会忘记Mysql的密码,或者想改一个密码,以下将对这两种情况修改密码的三种解决方法做个总结 本文都以用户为 root 为例 一.拥有原来的myql的root的密码 方法一: 在mysql ...

  2. js ajax设置和获取自定义header信息的方法总结

    目录 1.js ajax 设置自定义header 1.1 方法一: 1.2 方法二: 2.js ajax 获取请求返回的response的header信息 3.js ajax 跨域请求的情况下获取自定 ...

  3. pandas.read_sql_query()读取数据库数据用chunksize的坑

    最近一项工作需要读取数据库中1500万条数据,考虑到数据量太大,不方便直接一次性读取,不然会内存爆炸.想到用pandas.read_sql_query()里有一个chunksize可以分批返回chun ...

  4. pandas 学习 第1篇:pandas基础 - 数据结构和数据类型

    pandas是基于NumPy构建的模块,含有使数据分析更快更简单的操作工具和数据结构,是数据分析必不可少的五个包之一.pandas包含序列Series和数据框DataFrame两种最主要数据结构,索引 ...

  5. MySQL 中的外键

    表和表之间可存在引用关系,这在抽象数据到表时,是很常见的.这种联系是通过在表中创建外键(foreign key)来实现的. 比如一个订单,可能关联用户表和产品表,以此来记录谁买了什么产品. 约定两个概 ...

  6. elasticsearch 心得

    1.es 一台机器一般为一个节点.一台机器不设置的情况下是无法创建副本集的,副本集和主本必须不在一个节点下,方便故障转移等 2.es7.x后一个索引后只能创建一个类型,可以通过修改更改 出现这个的原因 ...

  7. Android 蓝牙开发(3)——蓝牙的详细介绍

    前面的两篇文章,主要是在 Android 官网关于蓝牙介绍的基础上加上自己的理解完成的.主要针对的是 Android 开发中的一些 API 的使用. 第一篇文章 Android 蓝牙开发(1) 主要是 ...

  8. 一文解读CQRS (转)

    先从CQRS说起,CQRS的全称是Command Query Responsibility Segregation,翻译成中文叫作命令查询职责分离.从字面上就能看出,这个模式要求开发者按照方法的职责是 ...

  9. [N久以前发布的文章]php 获取yahoo股票csv数据并封闭成为接口输出json数据

    思路 先从yahoo接口获取数据,再定义接口,转化成为json输出.只供卡通网(kt5.cn)使用 stock.php 接口处理代码 <?php header("Content-Typ ...

  10. 【微信小程序】安装EsayWechat简化微信小程序的开发

    1.安装easywechat composer require "overtrue/laravel-wechat" 2.文档 EasyWhchat官方文档