Kosaraju算法一看这个名字很奇怪就可以猜到它也是一个根据人名起的算法,它的发明人是S. Rao Kosaraju,这是一个在图论当中非常著名的算法,可以用来拆分有向图当中的强连通分量

背景知识

这里有两个关键词,一个是有向图,另外一个是强连通分量。有向图是它的使用范围,我们只能使用在有向图当中。对于无向图其实也存在强连通分量这个概念,但由于无向图的连通性非常强,只需要用一个集合维护就可以知道连通的情况,所以也没有必要引入一些算法。

有向图我们都了解,那么什么叫做强连通分量呢?强连通分量的英文是strongly connected components。这是一个很直白的翻译,要理解它我们首先需要理解强连通的概念。在有向图当中,如果两个点之间彼此存在一条路径相连,那么我们称这两个点强连通。那么推广一下,如果一张图当中的一个部分中的每两个点都连通,那么这个部分就称为强连通分量。

强连通分量一般是一张完整的图的一个部分,比如下面这张图当中的{1, 2, 3, 4}节点就可以被看成是一个强连通分量。

其实求解强连通分量的算法并不止一种,除了Kosaraju之外还有大名鼎鼎的Tarjan算法可以用来求解。但相比Tarjan算法,Kosaraju算法更加直观,更加容易理解。

算法原理

Kosaraju算法的原理非常简单,简单到只有三个步骤

  1. 我们通过后序遍历的方式遍历整个有向图,并且维护每个点的出栈顺序
  2. 我们将有向图反向,根据出栈顺序从大到小再次遍历反向图
  3. 对于点u来说,在遍历反向图时所有能够到达的v都和u在一个强连通分量当中

怎么样,是不是很简单?

下面我们来详细阐述一下细节,首先后序遍历和维护出栈顺序是一码事。也就是在递归的过程当中当我们遍历完了u这个节点所有连通的点之后,再把u加入序列。其实也就是u在递归出栈的时候才会被加入序列,那么序列当中存储的也就是每个点的出栈顺序。

这里我用一小段代码(python)演示一下,看完也就明白了。

popped = [] # 存储出栈节点

def dfs(u):
for v in Graph[u]:
dfs(v)
popped.append(u)

我们在访问完了所有的v之后再把u加入序列,这也就是后序遍历,和二叉树的后序遍历是类似的。

反向图也很好理解,由于我们求解的范围是有向图,如果原图当中存在一条边从u指向v,那么反向图当中就会有一条边从v指向u。也就是把所有的边都调转反向。

我们用上面的图举个例子,对于原图来说,它的出栈顺序我们用红色笔标出。

也就是[6, 4, 2, 5, 3, 1],我们按照出栈顺序从大到小排序,也就是将它反序一下,得到[1, 3, 5, 2, 4, 6]。1是第一个,也就是最后一个出栈的,也意味着1是遍历的起点。

我们将它反向之后可以得到:

我们再次从1出发可以遍历到2,3, 4,说明{1, 2, 3, 4}是一个强连通分量。

怎么样,整个过程是不是非常简单?

我们将这段逻辑用代码实现,也并不会很复杂。

// Cpp
// g 是原图,g2 是反图
void dfs1(int u) {
vis[u] = true;
for (int v : g[u])
if (!vis[v])
dfs1(v);
s.push_back(u);
} void dfs2(int u) {
color[u] = sccCnt;
for (int v : g2[u])
if (!color[v])
dfs2(v);
} void kosaraju() {
sccCnt = 0;
for (int i = 1; i <= n; ++i)
if (!vis[i])
dfs1(i);
for (int i = n; i >= 1; --i)
if (!color[s[i]]) {
++sccCnt;
dfs2(s[i]);
}
}
# python
N = 7
graph, rgraph = [[] for _ in range(N)], [[] for _ in range(N)]
used = [False for _ in range(N)]
popped = [] # 建图
def add_edge(u, v):
graph[u].append(v)
rgraph[v].append(u) # 正向遍历
def dfs(u):
used[u] = True
for v in graph[u]:
if not used[v]:
dfs(v)
popped.append(u) # 反向遍历
def rdfs(u, scc):
used[u] = True
scc.append(u)
for v in rgraph[u]:
if not used[v]:
rdfs(v, scc) # 建图,测试数据
def build_graph():
add_edge(1, 3)
add_edge(1, 2)
add_edge(2, 4)
add_edge(3, 4)
add_edge(3, 5)
add_edge(4, 1)
add_edge(4, 6)
add_edge(5, 6) if __name__ == "__main__":
build_graph()
for i in range(1, N):
if not used[i]:
dfs(i) used = [False for _ in range(N)]
# 将第一次dfs出栈顺序反向
popped.reverse()
for i in popped:
if not used[i]:
scc = []
rdfs(i, scc)
print(scc)

思考

算法讲完,代码也写了,但是并没有结束,仍然有一个很大的疑惑没有解开。算法的原理很简单,很容易学会,但问题是为什么这样做就是正确的呢?这其中的原理是什么呢?我们似乎仍然没有弄得非常清楚。

这里面的原理其实很简单,我们来思考一下,如果我们在正向dfs的时候,u点出现在了v点的后面,也就是u点后于v点出栈。有两种可能,一种可能是u点可以连通到v点,说明u是v的上游还有一种可能是u不能连通到v,说明图被分割成了多个部分。对于第二种情况我们先不考虑,因为这时候u和v一定不在一个连通分量里。对于第一种情况,u是v的上游,说明u可以连通到v。

这时候,我们将图反向,如果我们从u还可以访问到v,那说明了什么?很明显,说明了在正向图当中v也有一条路径连向u,不然反向之后u怎么连通到v呢?所以,u和v显然是一个强连通分量当中的一个部分。我们再把这个结论推广,所有u可以访问到的,第一次遍历时在它之前出栈的点,都在一个强连通分量当中。

如果你能理解了这一点,那么整个算法对你来说也就豁然开朗了,相信剩下的细节也都不足为虑了。

到这里,整个算法流程的介绍就算是结束了,希望大家都可以enjoy今天的内容。

算法学习笔记:Kosaraju算法的更多相关文章

  1. C / C++算法学习笔记(8)-SHELL排序

    原始地址:C / C++算法学习笔记(8)-SHELL排序 基本思想 先取一个小于n的整数d1作为第一个增量(gap),把文件的全部记录分成d1个组.所有距离为dl的倍数的记录放在同一个组中.先在各组 ...

  2. Manacher算法学习笔记 | LeetCode#5

    Manacher算法学习笔记 DECLARATION 引用来源:https://www.cnblogs.com/grandyang/p/4475985.html CONTENT 用途:寻找一个字符串的 ...

  3. [ML学习笔记] XGBoost算法

    [ML学习笔记] XGBoost算法 回归树 决策树可用于分类和回归,分类的结果是离散值(类别),回归的结果是连续值(数值),但本质都是特征(feature)到结果/标签(label)之间的映射. 这 ...

  4. 学习笔记 - Manacher算法

    Manacher算法 - 学习笔记 是从最近Codeforces的一场比赛了解到这个算法的~ 非常新奇,毕竟是第一次听说 \(O(n)\) 的回文串算法 我在 vjudge 上开了一个[练习],有兴趣 ...

  5. Johnson算法学习笔记

    \(Johnson\)算法学习笔记. 在最短路的学习中,我们曾学习了三种最短路的算法,\(Bellman-Ford\)算法及其队列优化\(SPFA\)算法,\(Dijkstra\)算法.这些算法可以快 ...

  6. 某科学的PID算法学习笔记

    最近,在某社团的要求下,自学了PID算法.学完后,深切地感受到PID算法之强大.PID算法应用广泛,比如加热器.平衡车.无人机等等,是自动控制理论中比较容易理解但十分重要的算法. 下面是博主学习过程中 ...

  7. Johnson 全源最短路径算法学习笔记

    Johnson 全源最短路径算法学习笔记 如果你希望得到带互动的极简文字体验,请点这里 我们来学习johnson Johnson 算法是一种在边加权有向图中找到所有顶点对之间最短路径的方法.它允许一些 ...

  8. 算法学习笔记——sort 和 qsort 提供的快速排序

    这里存放的是笔者在学习算法和数据结构时相关的学习笔记,记录了笔者通过网络和书籍资料中学习到的知识点和技巧,在供自己学习和反思的同时为有需要的人提供一定的思路和帮助. 从排序开始 基本的排序算法包括冒泡 ...

  9. 二次剩余Cipolla算法学习笔记

    对于同余式 \[x^2 \equiv n \pmod p\] 若对于给定的\(n, P\),存在\(x\)满足上面的式子,则乘\(n\)在模\(p\)意义下是二次剩余,否则为非二次剩余 我们需要计算的 ...

随机推荐

  1. 洛谷 P6419 Kamp 题解

    明天就SX AFO了交篇题解%一下 这题大概是我第一道有独立思考切掉的紫题 之前的都是各种抄借鉴题解 为什么写这题的题解呢?另一个重要的原因是这样的↓ 翻了翻已有题解中的几篇,下面几种情况屡见不鲜 样 ...

  2. C++学习---二叉树的输入及非递归遍历

    二叉树的二叉链表存储表示如下 //二叉树的二叉链表存储表示 typedef struct BiTNode { char data;//结点数据域 struct BiTNode* lchild, * r ...

  3. git学习(七) git的标签

    git的标签操作 git标签操作 git tag 不加任何参数 表示显示标签(按字母序) 非按时间 git tag 标签名 默认是给最近一次提交打上标签 git tag 标签名 commitId 给响 ...

  4. 最新版Python 3.8.6 版本发布

    Python 3.8.6 发布了,它是 Python 3.8 的第六个维护版本. 3.8 系列的维护版本将每两个月定期更新一次,3.8.7 计划于 2020 年 11 月中旬发布. 随着维护版本的发布 ...

  5. 设备屏幕与Size Class对应

  6. LeetCode 45跳跃游戏&46全排列

    原创公众号:bigsai,回复进群加入力扣打卡群. 昨日打卡:LeetCode 42字符串相乘&43通配符匹配 跳跃游戏 题目描述: 给定一个非负整数数组,你最初位于数组的第一个位置. 数组中 ...

  7. retrofit和RxJava结合

    public class MainActivity extends AppCompatActivity { @SuppressLint("CheckResult") protect ...

  8. hive drop和恢复partition external table

    在hdfs目录:/user/xx/table/test_external 保存 test_external 表数据 先建表,使用列式存储格式 CREATE external TABLE `test_e ...

  9. h5 语义话标签的意义

    使用语义话标签的意义 语义类标签对开发者更为友好,使用语义类标签增强了可读性,即便是在没有 CSS 的时 候,开发者也能够清晰地看出网页的结构,也更为便于团队的开发和维护. 除了对人类友好之外,语义类 ...

  10. 简简单单入个Redis的门

    Redis介绍 Redis是一种key-value的存储系统,它是一种nosql(Not Only [SQL])非关系型的数据库,它支持string(字符串).list(链表).set(集合).has ...