最长回文子串问题—Manacher算法

最长回文串问题是一个经典的算法题。

0. 问题定义

最长回文子串问题:给定一个字符串,求它的最长回文子串长度。
假设一个字符串正着读和反着读是一样的,那它就是回文串。以下是一些回文串的实例:

12321    a    aba    abba    aaaa   tattarrattat(牛津英语词典中最长的回文单词)

1. Brute-force解法

对于最长回文子串问题,最简单粗暴的办法是:找到字符串的全部子串,遍历每一个子串以验证它们是否为回文串。

一个子串由子串的起点和终点确定,因此对于一个长度为n的字符串,共同拥有n^2个子串。这些子串的平均长度大约是n/2。因此这个解法的时间复杂度是O(n^3)。

2. 改进的方法

显然全部的回文串都是对称的。长度为奇数回文串以最中间字符的位置为对称轴左右对称,而长度为偶数的回文串的对称轴在中间两个字符之间的空隙。可否利用这样的对称性来提高算法效率呢?答案是肯定的。我们知道整个字符串中的全部字符,以及字符间的空隙。都可能是某个回文子串的对称轴位置。能够遍历这些位置,在每一个位置上同一时候向左和向右扩展,直到左右两边的字符不同。或者达到边界。对于一个长度为n的字符串,这样的位置一共同拥有n+n-1=2n-1个。在每一个位置上平均大约要进行n/4次字符比較,于是此算法的时间复杂度是O(n^2)。

3. Manacher 算法

对于一个比較长的字符串,O(n^2)的时间复杂度是难以接受的。

Can we do better?
先来看看解法2存在的缺陷。

1)因为回文串长度的奇偶性造成了不同性质的对称轴位置。解法2要对两种情况分别处理。
2)非常多子串被反复多次訪问。造成较差的时间效率。

缺陷2)能够通过这个直观的小��体现:

char: a b a b a
i : 0 1 2 3 4

当i==1。和i==2时,左边的子串aba分别被遍历了一次。

假设我们能改善解法2的不足,就非常有希望能提高算法的效率。

Manacher正是针对这些问题改进算法。

(1) 解决长度奇偶性带来的对称轴位置问题。
Manacher算法首先对字符串做一个预处理。在全部的空隙位置(包含首尾)插入相同的符号。要求这个符号是不会在原串中出现的。这样会使得全部的串都是奇数长度的。

以插入#号为例:

aba  --->  #a#b#a#
abba ---> #a#b#b#a#

插入的是相同的符号,且符号不存在于原串,因此子串的回文性不受影响。原来是回文的串,插完之后还是回文的,原来不是回文的,依旧不会是回文。
(2)解决反复訪问的问题。
我们把一个回文串中最左或最右位置的字符与其对称轴的距离称为回文半径。Manacher定义了一个回文半径数组RL,用RL[i]表示以第i个字符为对称轴的回文串的回文半径。

我们一般对字符串从左往右处理,因此这里定义RL[i]为第i个字符为对称轴的回文串的最右一个字符与字符i的距离。

对于上面插入分隔符之后的两个串,能够得到RL数组:

char:    # a # b # a #
RL : 1 2 1 4 1 2 1
RL-1: 0 1 0 3 0 1 0
i : 0 1 2 3 4 5 6 char: # a # b # b # a #
RL : 1 2 1 2 5 2 1 2 1
RL-1: 0 1 0 1 4 1 0 1 0
i : 0 1 2 3 4 5 6 7 8

上面我们还求了一下RL[i]-1。

通过观察能够发现。RL[i]-1的值。正是在原本那个没有插入过分隔符的串中,以位置i为对称轴的最长回文串的长度。那么仅仅要我们求出了RL数组,就能得到最长回文子串的长度。

于是问题变成了,如何高效地求的RL数组。

基本思路是利用回文串的对称性,扩展回文串

我们再引入一个辅助变量MaxRight。表示当前訪问到的全部回文子串,所能触及的最右一个字符的位置。另外还要记录下MaxRight相应的回文串的对称轴所在的位置。记为pos。它们的位置关系例如以下。

imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" class="imagebubble-image" alt="" style="vertical-align:middle;border:0px;" />

我们从左往右地訪问字符串来求RL,假设当前訪问到的位置为i,即要求RL[i],在相应上图,i必定是在po右边的(obviously)。

但我们更关注的是。i是在MaxRight的左边还是右边。我们分情况来讨论。

1)当iMaxRight的左边;

情况1)能够用下图来刻画:

我们知道,图中两个红色块之间(包含红色块)的串是回文的;而且以i为对称轴的回文串,是与红色块间的回文串有所重叠的。我们找到i关于pos的对称位置j。这个j相应的RL[j]我们是已经算过的。

依据回文串的对称性,以i为对称轴的回文串和以j为对称轴的回文串,有一部分是相同的。这里又有两种细分的情况。
a. 以j为对称轴的回文串比較短,短到像下图这样。

这时我们知道RL[i]至少不会小于RL[j],而且已经知道了部分的以i为中心的回文串,于是能够令RL[i]=RL[j]。可是以i为对称轴的回文串可能实际上更长,因此我们试着以i为对称轴,继续往左右两边扩展,直到左右两边字符不同,或者到达边界。

b. 以j为对称轴的回文串非常长,这么长:

这时,我们仅仅能确定,两条蓝线之间的部分(即不超过MaxRight的部分)是回文的。于是从这个长度開始,尝试以i为中心向左右两边扩展,。直到左右两边字符不同,或者到达边界。
不论以上哪种情况,之后都要尝试更新MaxRightpos,因为有可能得到更大的MaxRight。

详细操作例如以下:

step 1: RL[i] <--- min(RL[2*pos-i], MaxRight-i)
step 2: 以i为中心扩展回文串,直到左右两边字符不同。或者到达边界。
step 3: 更新MaxRight和pos
2)当iMaxRight的右边。

遇到这样的情况,说明以i为对称轴的回文串还没有不论什么一个部分被訪问过。于是仅仅能从i的左右两边開始尝试扩展了,当左右两边字符不同,或者到达字符串边界时停止。然后更新MaxRightpos

(3)算法实现

def manacher(s):
#预处理
s='#'+'#'.join(s)+'#' RL=[0]*len(s)
MaxRight=0
pos=0
MaxLen=0
for i in range(len(s)):
if i<MaxRight:
RL[i]=min(RL[2*pos-i], MaxRight-i)
else:
RL[i]=1
#尝试扩展,注意处理边界
while i-RL[i]>=0 and i+RL[i]<len(s) and s[i-RL[i]]==s[i+RL[i]]:
RL[i]+=1
#更新MaxRight,pos
if RL[i]+i-1>MaxRight:
MaxRight=RL[i]+i-1
pos=i
#更新最长回文串的长度
MaxLen=max(MaxLen, RL[i])
return MaxLen-1

(4)复杂度分析
空间复杂度:插入分隔符形成新串。占用了线性的空间大小。RL数组也占用线性大小的空间,因此空间复杂度是线性的。

时间复杂度:虽然代码里面有两层循环,通过amortized analysis我们能够得出,Manacher的时间复杂度是线性的。因为内层的循环仅仅对尚未匹配的部分进行。因此对于每一个字符而言,仅仅会进行一次,因此时间复杂度是O(n)

4. 很多其它关于回文串的fun facts(主要来自维基百科)

4.1 人们在一座名为赫库兰尼姆的古城遗迹中。找到了一个好玩的拉丁语回文串:sator arepo tenet opera
rotas
。翻译成中文大概就是`一个叫做Arepo的播种者。他用力地扶(把)着车轮。

这个串的每一个单词首字母刚好组成了第一个单词,每一个单词的第二个字母刚好组成了第二个单词...于是乎,假设写出酱紫,你会发现上下左右四个方向读起来是一样的。这个串被称为 Sator Square.

imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" class="imagebubble-image" alt="" style="vertical-align:middle;border:0px;" />

4.2 本文开头给出的单词tattarrattat。出如今爱尔兰作家詹姆斯·乔伊斯的小说《尤利西斯》,是敲门的意思。吉尼斯纪录的最长回文英文单词是detartrated,是个化学术语。另外。还有些已出版的英文回文小说(你们歪果仁真会玩),比方Satire:
Veritas
Dr Awkward & Olson in Oslo等。

能够採用动态规划,列举回文串的起点或者终点来解最长回文串问题。无需讨论串长度的奇偶性。
看以下的代码。easy理解。

    public int longestPalindrome(String s) {
int n=s.length();
boolean[][] pal=new boolean[n][n];
//pal[i][j] 表示s[i...j]是否是回文串
int maxLen=0;
for (int i=0;i<n;i++){ // i作为终点
int j=i; //j作为起点
while (j>=0){
if (s.charAt(j)==s.charAt(i)&&(i-j<2||pal[j+1][i-1])){
pal[j][i]=true;
maxLen=Math.max(maxLen, i-j+1);
}
j--;
}
}
return maxLen;
}

求最长回文子串,O(n)复杂度的更多相关文章

  1. hdu 3068 最长回文(manachar求最长回文子串)

    题目连接:hdu 3068 最长回文 解题思路:通过manachar算法求最长回文子串,如果用遍历的话绝对超时. #include <stdio.h> #include <strin ...

  2. PAT甲题题解-1040. Longest Symmetric String (25)-求最长回文子串

    博主欢迎转载,但请给出本文链接,我尊重你,你尊重我,谢谢~http://www.cnblogs.com/chenxiwenruo/p/6789177.html特别不喜欢那些随便转载别人的原创文章又不给 ...

  3. Manacher模板( 线性求最长回文子串 )

    模板 #include<stdio.h> #include<string.h> #include<algorithm> #include<map> us ...

  4. 求最长回文子串 - leetcode 5. Longest Palindromic Substring

    写在前面:忍不住吐槽几句今天上海的天气,次奥,鞋子里都能养鱼了...裤子也全湿了,衣服也全湿了,关键是这天气还打空调,只能瑟瑟发抖祈祷不要感冒了.... 前后切了一百零几道leetcode的题(sol ...

  5. 后缀数组 - 求最长回文子串 + 模板题 --- ural 1297

    1297. Palindrome Time Limit: 1.0 secondMemory Limit: 16 MB The “U.S. Robots” HQ has just received a ...

  6. Manacher算法 O(n) 求最长回文子串

    转自:http://bbs.dlut.edu.cn/bbstcon.php?board=Competition&gid=23474 其实原文说得是比较清楚的,只是英文的,我这里写一份中文的吧. ...

  7. Manacher算法——求最长回文子串

    首先,得先了解什么是回文串.回文串就是正反读起来就是一样的,如“abcdcba”.我们要是直接采用暴力方法来查找最长回文子串,时间复杂度为O(n^3),好一点的方法是枚举每一个字符,比较较它左右距离相 ...

  8. manacher算法求最长回文子串

    一:背景 给定一个字符串,求出其最长回文子串.例如: s="abcd",最长回文长度为 1: s="ababa",最长回文长度为 5: s="abcc ...

  9. Manacher 求最长回文子串算法

    Manacher算法,是由一个叫Manacher的人在1975年发明的,可以在$O(n)$的时间复杂度里求出一个字符串中的最长回文子串. 例如这两个回文串“level”.“noon”,Manacher ...

随机推荐

  1. hdoj--2509--Be the Winner(尼姆博弈)

    Be the Winner Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) To ...

  2. python笔记:文件操作

    1.逐行打印整个文件 # -*- coding: utf-8 -*- f = open("test",'r',encoding="utf-8") count = ...

  3. FastDFS介绍(非原创)

    文章大纲 一.FastDFS介绍二.FastDFS安装与启动(Linux系统)三.Java客户端上传图片四.参考文章   一.FastDFS介绍 1. 什么是FastDFS FastDFS是用C语言编 ...

  4. OCC 矩阵变换

    在OpenCADCADE中, 通过gp_Trsf类来进行矩阵变换操作, 采用矩阵在左的方式: 新点 = 变换矩阵 * 点 基本原理如下: //! Defines a non-persistent tr ...

  5. python-sqlite3事务

    sqlite3事务总结: 在connect()中不传入 isolation_level 事务处理: 使用connection.commit() #!/usr/bin/env python # -*- ...

  6. (C++)错误提示 c2352 :非静态成员函数的非法调用

    静态成员函数相当于全局函数,只是有一个类名字空间的限制.而类成员函数是成员内部的函数,同一个类的对象实例可以有很多,每一个实例都有自已不同的成员变量值,成员函数一般都是对成员自已的成员变量值在操作.所 ...

  7. lua中.和:的区别

    local myTable = {} function myTable:putMyname(val) print(val) print(self and self.name) end myTable. ...

  8. 移动web开发常见的问题

    1.屏幕旋转的事件和样式 事件 window.orientation,取值:正负90表示横屏模式.0和180表现为竖屏模式: window.onorientationchange = function ...

  9. 熟悉VS2017 和Github 第二次作业

    GIT地址 https://github.com/Astone1213 GIT用户名  Astone1213 学号后五位  62114 博客地址 https://www.cnblogs.com/AsL ...

  10. 347. 前K个高频元素

    题目描述 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2] 示例 2: 输入: nums = ...