什么是最长公共子序列

X=ACCG

Y=CCAGCA

长度为1的公共子序列: {A} {C} {G}

长度为2的公共子序列:{AC} {CC} {CG} {AG}

长度为3的公共子序列:{ACG}

长度为4的公共子序列

最长公共子序列即为 {ACG}

问题:长度为N和M的两个序列如何求他们的最长公共子序列?

X = ACCGGGTTACCGTTTAAAACCCGGGTAACCT

Y = CCAGGACCAGGGACCGTTTACCAGCCTTAAACCA

简单算法

for (int i=N; i>0; --i) {

  找到X所有长度为i的子序列;

  找到Y所有长度为i的子序列;

  如果存在公共子序列则终止

}

复杂度O(2^N)

动态规划算法

定义C[i][j]为序列X[i..i]和Y[1..j]的最长子序列的长度

C[i][0]和C[0][j]==0

递推公式

C[i][j]=C[i-1][j-1]+1,  X[i]==Y[j]

C[i][j]=MAX(C[i-1][j], C[i][j-1]),  X[i]!=Y[j]

C++实现

template<typename T>
void prtM(vector< vector<T> >& arr, string msg = "") {
cout << msg << " " << endl;
for (auto i: arr) {
for (auto j: i) {
cout << j << " ";
}
cout << endl;
}
cout << endl;
} template <typename T>
void prt(vector<T>& arr, string msg = "") {
cout << msg << " ";
for (auto i: arr) {
cout << i << " ";
}
cout << endl;
} void prt_LCS(vector< vector<char> >& S, string& X, int i, int j) { // 递归调用
//cout << "i=" << i << " j=" << j << " " << S[i][j] << endl;
if (i== || j == )
return;
if ('s' == S[i][j]) {
prt_LCS(S, X, i-, j-);
cout << X[i];
} else if ('j' == S[i][j]) {
prt_LCS(S, X, i, j-);
} else {
prt_LCS(S, X, i-, j);
}
} void calc_LCS(string& X, string& Y) {
cout << "X: " << X << endl;
cout << "Y: " << Y << endl; vector< vector<int> > C; // 序列X[0..i] and Y[0..j]的公共子序列的长度
vector< vector<char> > S;  //最长公共子串的位置
for (int i=; i<X.size(); i++) {
C.push_back( vector<int>(Y.size()) );  
S.push_back( vector<char>(Y.size()) );
} for (int i=; i<X.size(); i++)
C[i][] = ;
for (int j=; j<Y.size(); j++)
C[][j] = ; for (int i=; i<X.size(); i++)
for (int j=; j<Y.size(); j++) {
if (X[i] == Y[j]) {
C[i][j] = C[i-][j-] + ;
S[i][j] = 's'; // 相同,可以打印
} else if ( C[i][j-] > C[i-][j] ) {
C[i][j] = C[i][j-];
S[i][j] = 'j';  //Y的最后一个可以去掉,不影响LCS
} else {
C[i][j] = C[i-][j] ;
S[i][j] = 'i';  //X的最后一个可以去掉,不影响LCS
}
} prtM(C);
prtM(S);
prt_LCS(S, X, X.size()-, Y.size()-);
cout<< endl;
} int main() { string S1 = " ACCGGGTTAC"; // 为了方便表示,忽略第一个字符
string S2 = " AGGACCA"; calc_LCS(S1, S2); return ;
}

算法实践--最长公共子序列(Longest Common Subsquence)的更多相关文章

  1. 算法实践--最长递增子序列(Longest Increasing Subsquence)

    什么是最长递增子序列(Longest Increasing Subsquence) 对于一个序列{3, 2, 6, 4, 5, 1},它包含很多递增子序列{3, 6}, {2,6}, {2, 4, 5 ...

  2. 最长公共子序列(Longest common subsequence)

    问题描述: 给定两个序列 X=<x1, x2, ..., xm>, Y<y1, y2, ..., yn>,求X和Y长度最长的公共子序列.(子序列中的字符不要求连续) 这道题可以 ...

  3. 算法练习——最长公共子序列的问题(LCS)

    问题描述: 对于两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列.X  Y   各自字符串有顺序,但是不一定需要相邻. 最长公共子串(Longest Common Subst ...

  4. 最长公共子串(Longest common substring)

    问题描述: 给定两个序列 X=<x1, x2, ..., xm>, Y<y1, y2, ..., yn>,求X和Y长度最长的公共子串.(子串中的字符要求连续) 这道题和最长公共 ...

  5. Java实现 蓝桥杯VIP 算法提高 最长公共子序列

    算法提高 最长公共子序列 时间限制:1.0s 内存限制:256.0MB 问题描述 给定两个字符串,寻找这两个字串之间的最长公共子序列. 输入格式 输入两行,分别包含一个字符串,仅含有小写字母. 输出格 ...

  6. 【算法】最长公共子序列(nlogn)

    转载注明出处:http://blog.csdn.net/wdq347/article/details/9001005 (修正了一些错误,并自己重写了代码) 最长公共子序列(LCS)最常见的算法是时间复 ...

  7. ACM/ICPC 之 最长公共子序列计数及其回溯算法(51Nod-1006(最长公共子序列))

    这道题被51Nod定为基础题(这要求有点高啊),我感觉应该可以算作一级或者二级题目,主要原因不是动态规划的状态转移方程的问题,而是需要理解最后的回溯算法. 题目大意:找到两个字符串中最长的子序列,子序 ...

  8. 利用后缀数组(suffix array)求最长公共子串(longest common substring)

    摘要:本文讨论了最长公共子串的的相关算法的时间复杂度,然后在后缀数组的基础上提出了一个时间复杂度为o(n^2*logn),空间复杂度为o(n)的算法.该算法虽然不及动态规划和后缀树算法的复杂度低,但其 ...

  9. [Swift]LeetCode14. 最长公共前缀 | Longest Common Prefix

    Write a function to find the longest common prefix string amongst an array of strings. If there is n ...

随机推荐

  1. Git:一个简单示例

    初始状态:两个分支master/dev都只有一个文件readme.txt 待解决问题:在master分支新增文件,并且修改readme.txt文件,将上述操作同步至远程master分支,最后同步到de ...

  2. react-thunk的使用流程

    react-thunk作用:使我们可以在action中返回函数,而不是只能返回一个对象.然后我们可以在函数中做很多事情,比如发送异步的ajax请求. 这就是react-thunk的使用方法.接受一个d ...

  3. linux timing profile

    double getUnixTime(void) { struct timespec tv; ) ; return (((double) tv.tv_sec) + (double) (tv.tv_ns ...

  4. 简单excel导入导出

    import java.io.File;import java.io.IOException; import jxl.Cell;import jxl.Sheet;import jxl.Workbook ...

  5. Linux c读取任意大小文件的所有数据

    代码如下,执行完之后被分配的动态内存的指针会保存到result中.由于是动态分配内存,读取内容不再使用之后注意用free 释放掉,如不明白,请多搜索以下动态内存分配的资料. #include < ...

  6. nginx优化参考

    参考链接:http://blog.sina.com.cn/s/blog_4f9fc6e10102uxib.html 计算访问路径频度 awk -r|more |grep /路径 ps print &a ...

  7. LeetCode 60 第K个排列

    题目: 给出集合 [1,2,3,…,n],其所有元素共有 n! 种排列. 按大小顺序列出所有排列情况,并一一标记,当 n = 3 时, 所有排列如下: "123" "13 ...

  8. Problem B: 平面上的点和线——Point类、Line类 (II)

    Description 在数学上,平面直角坐标系上的点用X轴和Y轴上的两个坐标值唯一确定,两点确定一条线段.现在我们封装一个“Point类”和“Line类”来实现平面上的点的操作. 根据“append ...

  9. noj二分查找

    二分查找: 要么左边,要么右边,哈哈哈哈 描述 给定一个单调递增的整数序列,问某个整数是否在序列中.   输入 第一行为一个整数n,表示序列中整数的个数:第二行为n(n不超过10000)个整数:第三行 ...

  10. Python函数定义、文件操作(读写、修改)

    date:2018421 day3 一.函数定义 def  函数名(首字母大写) 增加程序可读性 #直接写函数名即可调用函数 #参数 ①.形参 ②.实参 ③.缺省参数 如果有默认值,调用的时候没有传递 ...