Longest Common Substring

  • Brute Force

    遍历ab所有位置的组合,向后延伸,直到遇到两个不同的字符,复杂度是\(n^3\)级别。
class Solution {
public:
// 返回所有结果
vector<string> longestCommonSubstring(string& a, string& b) {
vector<string> ans;
int maxLen = 0;
for (int i = 0; i < a.size(); ++i) {
for (int j = 0; j < b.size(); ++j) {
string cur;
for (int m = i, n = j; m < a.size() && n < b.size(); ++m, ++n) {
if (a[m] != b[n]) {
break;
}
cur += a[m];
}
if (cur.size() && cur.size() >= maxLen) {
maxLen = cur.size();
ans.push_back(cur);
}
}
}
return ans;
}
};
  • DP

    暴力解有很多重复计算:比如以\(i\)和\(j\)为起点去向后延伸,我们可能需要比较\(i+1\)和\(j+1\)、\(i+2\)和\(j+2\)...而以\(i+1\)和\(j+1\)为起点时,仍然要比较\(i+2\)和\(j+2\),重叠子问题给动态规划带来了可能。

    暴力做法是将每个\(i\)和\(j\)作为起点,现在我们考虑将\(i\)和\(j\)作为终点,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的相同子串的最大长度,很快就可以推出:

\[L(i,j)=
\begin{cases}
1+L(i-1,j-1)& \text{a[i]=b[j]}\\
0& \text{a[i]!=b[j]}
\end{cases}\]

为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。

class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
vector<vector<int>> L(1 + a.size(), vector<int>(1 + b.size(), 0));
int maxLen = 0; for (int i = 1; i <= a.size(); ++i) {
for (int j = 1; j <= b.size(); ++j) {
if (a[i - 1] == b[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = 0;
}
maxLen = max(maxLen, L[i][j]);
}
} return maxLen;
}
};

显然时间降为\(O(n^2)\),空间升为\(O(n^2)\)。仔细观察,计算\(L(i,j)\)只需要左上方\(L(i-1,j-1)\)的信息,所以我们按照斜线方向计算,可以将空间优化到\(O(1)\):

class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
// from the up-right corner
int row = 0, col = b.size() - 1;
int maxLen = 0; while (row < a.size()) {
int curLen = 0;
for (int i = row, j = col; i < a.size() && j < b.size(); ++i, ++j) {
if (a[i] == b[j]) {
++curLen;
}
else {
curLen = 0;
}
maxLen = max(maxLen, curLen);
}
if (col > 0) {
--col; // 斜线左移
}
else {
++row; // 斜线下移
}
} return maxLen;
}
};

(TODO)输出所有的最长公共子串

Longest Common Subsequence

  • Brute Force

    找到a的所有子序列,判断是否是b的子序列,指数级复杂度,也就没有写出来的必要了。
  • DP

    重叠子问题很明显,而且LCS具有最优子结构,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的LCS长度:

\[L(i,j)=
\begin{cases}
1+L(i-1,j-1)& \text{a[i]=b[j]}\\
max\{L(i-1,j),L(i,j-1)\}& \text{a[i]!=b[j]}
\end{cases}\]

为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。

class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
vector<vector<int>> L(m + 1, vector<int>(n + 1, 0));
int ans = 0;
for(int i = 1;i <= m;++i) {
for(int j = 1;j <= n;++j) {
if(text1[i - 1] == text2[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = max(L[i - 1][j], L[i][j - 1]);
}
ans = max(ans, L[i][j]);
}
} return ans;
}
};

时间和空间都是\(O(mn)\)。类似的,\(L(i,j)\)依赖于左上角\(L(i-1,j-1)\)、左边\(L(i,j-1)\)、上边\(L(i-1,j)\),可以只存储上一行和当前行的\(L\)。进一步考虑:可以只存储当前行的\(L\),外加一个变量\(pre\)存储左上角\(L(i-1,j-1)\),空间可以优化到\(O(min(m,n))\):

class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
if(m < n) {
return longestCommonSubsequence(text2, text1);
} vector<int> curRow(n + 1, 0);
int pre = 0, ans = 0;
for(int i = 1;i <= m;++i) {
pre = curRow[0];
for(int j = 1;j <= n;++j) {
int tmp = curRow[j];
if(text1[i - 1] == text2[j - 1]) {
curRow[j] = 1 + pre;
}
else {
curRow[j] = max(curRow[j], curRow[j - 1]);
}
ans = max(ans, curRow[j]);
pre = tmp;
}
} return ans;
}
};

(TODO)输出所有的最长公共子串

Longest Increasing Subsequence

  • DP

    \(dp[i]\)表示只考虑\(i\)及之前的信息,所形成的LIS的长度:

\[dp[i]=
\begin{cases}
1+max\{dp[j]\}, 0 \leq j<i& \text{a[i]>a[j]}\\
max\{dp[j])\}, 0 \leq j<i& \text{a[i]$\leq$a[j]}
\end{cases}\]

最终答案即是\(dp\)数组的最大值:

class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
if(!nums.size()) {
return 0;
}
vector<int> dp(nums.size(), 1);
int ans = 1; for(int i = 1;i < nums.size();++i) {
int curMax = 0;
for(int j = 0;j < i;++j) {
if(nums[i] > nums[j]) {
curMax = max(curMax, dp[j]);
}
}
dp[i] = 1 + curMax;
ans = max(ans, dp[i]);
} return ans;
}
};

时间\(O(n^2)\),空间\(O(n)\)。

  • DP+Binary Search

    遍历数组的过程中,不停填充\(dp\)数组,维护\(dp\)数组使得其存储递增序列:

    如果\(nums[i]<dp[0]\),更新\(dp[0]\);

    如果\(nums[i]>dp[len]\),\(++len\),并且存入\(nums[i]\);

    如果\(nums[i]\)介于\(dp\)中间,就二分查找\(nums[i]\)的位置,并更新相应的\(dp\)值。

    举例来说,\(nums=[0,8,4,12,2]\),\(dp\)数组:

    \([0]\)

    \([0,8]\)

    \([0,4]\)

    \([0,4,12]\)

    \([0,2,12]\)

    虽然\(dp\)数组最终存储的不是LIS,但长度确是LIS的长度:
class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
const int n = nums.size();
if(0 == n)
return 0; vector<int> dp(n);
dp[0] = nums[0];
int len = 0;
for(int i = 1;i < n;++i) {
if(nums[i] < dp[0]) {
dp[0] = nums[i];
}
else if(nums[i] > dp[len]) {
dp[++len] = nums[i];
}
else {
int index = biSearch(dp, 0, len, nums[i]);
dp[index] = nums[i];
}
}
return len + 1;
}
private:
int biSearch(vector<int>& nums, int l, int r, int target) {
while(l < r) {
int m = l + (r - l) / 2;
if(nums[m] == target) {
return m;
}
if(target > nums[m]) {
l = m + 1;
}
else {
r = m;
}
}
return l;
}
};

时间\(O(nlgn)\),空间\(O(n)\)。

Longest Palindromic Substring

  • Brute Force

    枚举每个子串的起始和结束位置,判断是否回文。时间\(O(n^3)\),空间\(O(1)\)。
  • DP

    假设输入ababa,如果我们已经判断了bab是回文的,那么ababa就不需要再扫描一遍,因为两端都是a

    所以一个很直观的动规:

    令\(dp(i,j)\)去记忆\(i\)和\(j\)之间的串是否回文,那么转移方程:

\[dp(i,j)=dp(i+1,j-1)\&\&s[i]=s[j]
\]

边界条件\(dp(i,i)=true,dp(i,i+1)=(s[i]=s[i+1])\):

// 填充方向:由边界条件dp(i,i)向其他地方扩展,只需要填充j>i的三角形部分
class Solution {
public:
string longestPalindrome(string s) {
vector<vector<bool>> dp(s.length() + 1, vector<bool>(s.length() + 1, false));
int start = 0, end = 0;
int maxLen = 1;
for (int i = 0; i < s.length(); ++i) {
dp[i][i] = true;
if (i < s.length() - 1) {
if (s[i] == s[i + 1]) {
dp[i][i + 1] = true;
start = i;
end = i + 1;
}
else {
dp[i][i + 1] = false;
}
}
} for (int i = s.length() - 1; i >= 0; --i) {
for (int j = i + 2; j < s.length(); ++j) {
if (s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1];
if (dp[i][j] && maxLen < j - i + 1) {
start = i;
end = j;
maxLen = end - start + 1;
}
}
else {
dp[i][j] = false;
}
}
}
return s.substr(start, end - start + 1);
}
};

时间\(O(n^2)\),空间\(O(n^2)\)。

  • Expand Around Center

    回文串都是镜像对称的,可以遍历整个串,从当前位置向两边延伸,直到遇到不相等的字母。这里要考虑字符串长度的奇偶:
class Solution {
public:
string longestPalindrome(string s) {
const int n = s.length();
if (!n)
return ""; int start = 0, end = 0;
for (int i = 0; i < n; ++i) {
int len1 = expandCenter(s, i, i);
int len2 = expandCenter(s, i, i + 1);
int len = max(len1, len2);
if (len > end - start + 1) {
start = i - (len - 1) / 2;
end = i + len / 2;
}
}
return s.substr(start, end - start + 1);
}
private:
int expandCenter(string s, int start, int end) {
while (start >= 0 && end < s.length() && s[start] == s[end]) {
--start;
++end;
}
return end - start - 1;
}
};

时间\(O(n^2)\),空间\(O(1)\)。

  • Manacher's Algorithm(待填)

    时间\(O(n)\)。

Longest Palindromic Subsequence

  • DP

    令\(dp(i,j)\)表示介于\(i\)和\(j\)间的LPS的长度,那么状态转移方程:

\[dp(i,j)=
\begin{cases}
2+dp(i+1,j-1)& \text{s[i]=s[j]}\\
max\{dp(i+1,j),dp(i,j-1)\}& \text{s[i]$\neq$s[j]}
\end{cases}\]

class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
} vector<vector<int>> dp(n, vector<int>(n, 0));
int ans = 1;
for(int i = n - 1;i >= 0;--i) {
for(int j = i;j < n;++j) {
if(i == j) {
dp[i][j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1] + 2;
}
else {
dp[i][j] = max(dp[i + 1][j], dp[i][j - 1]);
}
ans = max(ans, dp[i][j]);
}
} return ans;
}
};

时间\(O(n^2)\),空间\(O(n^2)\)。

同样,空间可以优化到\(O(n)\)。

class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
} vector<int> dp(n, 0);
int ans = 1, pre = 0;
for(int i = n - 1;i >= 0;--i) {
pre = dp[0];
for(int j = i;j < n;++j) {
int tmp = dp[j];
if(i == j) {
dp[j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[j] = pre + 2;
}
else {
dp[j] = max(dp[j - 1], dp[j]);
}
pre = tmp;
ans = max(ans, dp[j]);
}
} return ans;
}
};

Longest XXX的更多相关文章

  1. Linux 日志报错 xxx blocked for more than 120 seconds

    监控作业发现一台服务器(Red Hat Enterprise Linux Server release 5.7)从凌晨1:32开始,有一小段时间无法响应,数据库也连接不上,后面又正常了.早上检查了监听 ...

  2. 记一个mvn奇怪错误: Archive for required library: 'D:/mvn/repos/junit/junit/3.8.1/junit-3.8.1.jar' in project 'xxx' cannot be read or is not a valid ZIP file

    我的maven 项目有一个红色感叹号, 而且Problems 存在 errors : Description Resource Path Location Type Archive for requi ...

  3. LeetCode[3] Longest Substring Without Repeating Characters

    题目描述 Given a string, find the length of the longest substring without repeating characters. For exam ...

  4. 最长回文子串-LeetCode 5 Longest Palindromic Substring

    题目描述 Given a string S, find the longest palindromic substring in S. You may assume that the maximum ...

  5. [LeetCode] Longest Substring with At Least K Repeating Characters 至少有K个重复字符的最长子字符串

    Find the length of the longest substring T of a given string (consists of lowercase letters only) su ...

  6. eclipse 突然 一直在loading descriptor for XXX (XXX为工程名)Cancel Requested

    问题: eclipse 启动后,啥也不干,就一直在loading descriptor for XXX (XXX为工程名),,其他什么操作都不能操作. 如下图所示,保存文件也无法保存.  这个怎么办? ...

  7. leetcode--5. Longest Palindromic Substring

    题目来自 https://leetcode.com/problems/longest-palindromic-substring/ 题目:Given a string S, find the long ...

  8. 现有语言不支持XXX方法

    史上最强大的IDE也会有bug的时候哈,今天遇到这个问题特别郁闷,百度了下,果然也有人遇到过这个问题 解决方法: 1.调用的时候参数和接口声明的参数不一致(检查修改) 2.继承接口中残留一个废弃的方法 ...

  9. An App ID with Identifier 'com.XXX.XXX’ is not available. Please enter a different string.报错

    昨天刚刚升的Xcode7.3和iOS9.3,然后没怎么使用这两样就下班了,但是今天早上来了之后,就发现突然之间不能真机测试和运行代码了,一看才发现xcode报错: An App ID with Ide ...

随机推荐

  1. 对EL自己以及对于param、header、cookie的相关应用的相关知识点的复习

    EL表达式语言是一种可以计算和输出的java对象的简单语言. 列入请求语句为下面的方式:request.setAttribute("username","zhangsan ...

  2. Centos 7 系统定时重启

    crontab -e         //系统命令 00 08 * * * root systemctl restart docker00 08 * * * root reboot //写入需要重启的 ...

  3. MySQL入门,第一部分,全局管理命令

    1.连接数据库命令 mysql -h localhost -u root -p 回车后输入密码即可连接到数据库 2.显示当前mysql管理系统中的所有数据库 SHOW DATABASES; 3.显示当 ...

  4. String与StringBuffer和StringBuilder的根本区别(String为什么无法修改字符串长度)

    从网上看了很多的信息,说的大部分是关于final修饰的原因,却没有详细的解释!根据自己收集的资料,跟大家分享一下我的观点(有错请指正).1.我们都知道在修改字符串长度的时候,StringBuffer和 ...

  5. typename 关键字

    1.class关键字的同义词 template <typename T> const T& max(const T& x, const T& y) { return ...

  6. docker 安装vim和yum命令

    apt-get updateapt-get install vim -yapt-get install yum -y

  7. D3js怎么获得SVG及其子元素在屏幕中的坐标

    var clientRects = svg.select("image").node().getBoundingClientRect(); var coordinates = [ ...

  8. Python 注释(Python Comments)用法详解

    目录 1 Python 注释概述 2 Python 注释的作用 2.1 调试代码 2.2 提高程序的可读性 3 Python 单行注释 3.1 Python 单行注释概述 3.2 单行注释注释单行代码 ...

  9. 【原创干货】大数据Hadoop/Spark开发环境搭建

    已经自学了好几个月的大数据了,第一个月里自己通过看书.看视频.网上查资料也把hadoop(1.x.2.x).spark单机.伪分布式.集群都部署了一遍,但经历短暂的兴奋后,还是觉得不得门而入. 只有深 ...

  10. CSS 中你应该了解的 BFC

    我们常说的文档流其实分为定位流.浮动流和普通流三种.而普通流其实就是指BFC中的FC.FC是formatting context的首字母缩写,直译过来是格式化上下文,它是页面中的一块渲染区域,有一套渲 ...