动态连通性问题：union-find算法

写在前面的话：

一枚自学Java和算法的工科妹子。

算法学习书目：算法（第四版） Robert Sedgewick
算法视频教程：Coursera Algorithms Part1&2

本文是根据《算法（第四版）》的个人总结，如有错误，请批评指正。

一、动态连通性问题介绍

1.基本概念：

问题的输入是一列整数对，每个整数都表示一个某种类型的对象，一对整数“p q”表示的含义是“p和q相连”。
“相连”是一种等价关系：1）自反性（p与p相连接）；2）对称性（若p连接到q，那么q也连接到p）；3）传递性（若p连接到q，q连接到r，则p连接到r）。
等价关系将对象分成多个等价类，它们构成多个集合，称为“连通组件”（Connected Components）。

2.目标：设计一个程序，保存所有的整数对信息，并判断一对输入的对象是否相连。

3.应用：

计算机网络。若这些数字编号的对象是大型计算机网络中的各计算机设备，点对序列即表示了计算机之间的通信连接。因此我们的算法能够判断对于某两台计算机p和q，要使它们能够互相通信，是需要建立新的连接，还是可以利用已有的线路建立一个通信路径。
社交网络。数字编号的物体代表Facebook上的用户，而点对表示朋友关系，那么我们的算法就可以在两个用户之间建立朋友关系，或者查找他们俩有没有“可能认识的人”。
变量名的等价性。在某些编程语言中，可以用我们的算法来检测某两个变量是否是等价的（都指向同一对象）。
数学上的集合论。可以判断某两个整数是否属于同一集合。

二、动态连通性问题分析和建模

动态连通性问题只要求判断给定的整数p和q是否连通，并不要求给出两者之间的所有连接。设计并查集算法的API封装以下操作：初始化，连接两个对象，查找某对象所在的集合的标识符，判断两对象是否相连，统计连通集合的数目。

图1 并查集算法的API设计

解决连通性问题就是实现并查集算法的API：

定义一种数据结构表示已知的连接；
基于此数据结构实现高效的union()，find()，connected()，count().

三、union-find算法的实现

下面讨论四种不同的实现，它们均以id[]数组来确定两个对象是否存在于相同的连通分量。

1.quick-find算法

quick-find算法是保证当且仅当id[p]=id[q]时p和q是连通的，因此同一个连通集合的所有对象的id全部相同。
find(p)：返回p的id，同一个连通集合的所有对象的id全部相同；
connected(p,q)：判断id[p]==id[q]?
union(p,q)：先用 connected(p,q)判断p和q是否相连，若不相连（p所在集合的id为一个值，q所在集合的id为另一个值），遍历数组所有元素，将p所在集合的对象的id全部改为id[q].

图2 quick-find算法:find(5,9)和union(5,9)

 public class QuickFindUF {

     private int[] id;    // 对象的id

     private int count;   // 连通集合数量

    // 初始化对象id数组

     public QuickFindUF(int n) {

         count = n;

         id = new int[n];

         for (int i = 0; i < n; i++)

             id[i] = i;

     }

    // 返回连通集合数量

     public int count() {

         return count;

     }

    // 返回对象p的id

     public int find(int p) {

         return id[p];

     }

    // 判断p和q是否相连

     public boolean connected(int p, int q) {

         validate(p);

         validate(q);

         return id[p] == id[q];

     }

    // 将p和q归并到同一个集合

     public void union(int p, int q) {

         validate(p);

         validate(q);

         int pID = id[p];   // needed for correctness

         int qID = id[q];   // to reduce the number of array accesses

         // p q已经在同一个集合则不需要采取任何行动

         if (pID == qID) return;

         // 将p所在的集合的所有对象重新赋值id为id[q]

         for (int i = 0; i < id.length; i++)

             if (id[i] == pID) id[i] = qID;

         count--;

     }

 }

quick-find算法分析（含有N个对象）：

每次find()调用只需访问数组一次；
每次归并两个集合的union()操作需要访问数组次数在（N+3）~（2N+1）之间。（最好的情况p所在集合只有p一个对象：2+N+1=N+3,最坏情况除了q以后所有对象都在p所在集合：2+N+N-1=2N+1）

因此使用quick-find算法解决动态连通性问题并且最后使所有对象都在一个连通集合，至少需要调用N-1次union()，即至少(N+3)(N-1)~N²次访问数组。

2.quick-union算法

quick-find算法的union操作需要遍历整个数组才能完成，为提高union()方法的速度，提出quick-union算法。
quick-union算法的策略：parent[p]为节点p的父节点，若id[p] == p，则称p为根节点（root），当且仅当两个节点的根节点相等时，两个节点处于同一连通集合中。那么初始状态下的N个节点就可以看成N棵只有一个节点的树构成的“森林”，而id数组则记录了每个节点的父节点，若两个节点的根节点相等，那么这两个节点就是相连接的。
find(p)：沿着路径一直向上回溯，直到找到根节点parent[r] == r；
union(p,q)：先找到节点p和q各自的根节点pRoot和qRoot，然后修改p的父节点parent[p]=qRoot。

图3 quick-union算法:find(5,9)和union(5,9)

 public class QuickUnionUF {

     private int[] parent;  // 父节点

     private int count;     // 连通集合数目

     public QuickUnionUF(int n) {

         parent = new int[n];

         count = n;

         for (int i = 0; i < n; i++) {

             parent[i] = i;

         }

     }

     public int count() {

         return count;

     }

     public int find(int p) {

         while (p != parent[p])

             p = parent[p];

         return p;

     }

     public boolean connected(int p, int q) {

         return find(p) == find(q);

     }

     public void union(int p, int q) {

         int rootP = find(p);

         int rootQ = find(q);

         if (rootP == rootQ) return;

         // 将p所在的树连接到q的根节点rootQ上

         parent[rootP] = rootQ;

         count--;

     }

 }

quick-union算法分析（含有N个节点）：

union()：所有节点全部归并到一个集合，最坏的情况就是0连接到1,1连接到2,2连接到3...如此循环，构造0-1-2-3-4……-N-1形式的一棵很“高”的树，根节点是N-1，总共访问数组的次数(N-1)+2[1+2+...+(N-1)]+(N-1)~N²
前面的(N-1)表示像树上每增加一个节点i(i=1,2,3,...,N-1)，find(i)访问数组的总次数；
中间的2[1+2+...+(N-1)]表示对树尾部的节点0，find(0)访问数组的总次数；
最后的(N-1)表示将节点0的根节点设为i(i=1,2,3,...,N-1)，访问数组的总次数.

3.加权quick-union算法

加权quick-find算法在quick-find算法修改程序，避免出现高度很高的树。一种加权策略就是记录每棵树的节点个数，并总是在执行union操作时用小树（节点较少）的根节点指向大树（节点较多）来保持平衡。
加权quick-find算法策略：增加一个数组sz[]来存储每棵树的节点个数，一开始将sz[]全部初始化为1，每次执行union操作时根据sz[]数组进行判断，将小树根节点指向大树的根节点，并更新大树对应的sz[]值。

图4 加权quick-find算法降低树高度

 public class WeightedQuickUnionUF {

     private int[] parent;   // parent[i] = parent of i

     private int[] size;     // size[i] = number of sites in subtree rooted at i

     private int count;      // number of components

     public WeightedQuickUnionUF(int n) {

         count = n;

         parent = new int[n];

         size = new int[n];

         for (int i = 0; i < n; i++) {

             parent[i] = i;

             size[i] = 1;

         }

     }

     public int count() {

         return count;

     }

     public int find(int p) {

         while (p != parent[p])

             p = parent[p];

         return p;

     }

     public boolean connected(int p, int q) {

         return find(p) == find(q);

     }

     public void union(int p, int q) {

         int rootP = find(p);

         int rootQ = find(q);

         if (rootP == rootQ) return;

         // make smaller root point to larger one

         if (size[rootP] < size[rootQ]) {

             parent[rootP] = rootQ;

             size[rootQ] += size[rootP];

         }

         else {

             parent[rootQ] = rootP;

             size[rootP] += size[rootQ];

         }

         count--;

     }

 }

加权quick-union算法分析（含有N个节点）：

对于N个节点，加权quick-union算法构造的森林中任意节点的深度最多为lgN（由归纳算法推到得，不明白的朋友可以留言或发邮件询问）
因此，在最坏的情况下，find()、connected()和union()的成本增长数量级为lgN。

4.路径压缩的加权quick-union算法

理想情况下，希望每个节点都直接连接在它的根节点上，但是又不像quick-find那样union方法要遍历所有节点。要实现路径压缩，只需要为find()添加一个循环，将在路径上遇到的所有点都直接连接到根节点。
路径压缩的加权quick-union算法已经是最优的算法了，但是并非所有的操作都能在常数时间内完成。

 public class PathCompressWQU {

     private int[] parent;   // parent[i] = parent of i

     private int[] size;     // size[i] = number of sites in subtree rooted at i

     private int count;      // number of components

     public PathCompressWQU(int n) {

         count = n;

         parent = new int[n];

         size = new int[n];

         for (int i = 0; i < n; i++) {

             parent[i] = i;

             size[i] = 1;

         }

     }

     public int count() {

         return count;

     }

     public int find(int p) {

         int temp=p;

         while (p != parent[p])

             p = parent[p];

         while(temp != parent[p]){

             int tempParent = parent[temp];

             parent[temp] = parent[p];

             temp = tempId;

           }

         return parent[p];

     }

     public boolean connected(int p, int q) {

         return find(p) == find(q);

     }

     public void union(int p, int q) {

         int rootP = find(p);

         int rootQ = find(q);

         if (rootP == rootQ) return;

         // make smaller root point to larger one

         if (size[rootP] < size[rootQ]) {

             parent[rootP] = rootQ;

             size[rootQ] += size[rootP];

         }

         else {

             parent[rootQ] = rootP;

             size[rootP] += size[rootQ];

         }

         count--;

     }

 }

四、四种union-find算法的性能对比

作者： 邹珍珍（Pearl_zhen）

出处： http://www.cnblogs.com/zouzz/

声明：本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接如有问题，可邮件（zouzhenzhen@seu.edu.cn）咨询.

动态连通性问题：union-find算法的更多相关文章

《算法4》1.5 - Union-Find 算法解决动态连通性问题，Python实现
Union-Find 算法(中文称并查集算法)是解决动态连通性(Dynamic Conectivity)问题的一种算法,作者以此为实例,讲述了如何分析和改进算法,本节涉及三个算法实现,分别是Quick ...
动态连通性问题——算法union-find
问题定义:问题的输入是一列整数对,其中每个整数都表示一个某种类型的对象,一对整数p,q可以被理解为"p和q是相连的".我们假设“相连”是一种对等的关系. 这也意味着它具有: 1.自 ...
【VS开发】【图像处理】基于灰度世界、完美反射、动态阈值等图像自动白平衡算法的原理、实现及效果
基于灰度世界.完美反射.动态阈值等图像自动白平衡算法的原理.实现及效果白平衡是电视摄像领域一个非常重要的概念,通过它可以解决色彩还原和色调处理的一系列问题.白平衡是随着电子影像再现色彩真实 ...
关于连通性问题的Tarjan算法暂结
关于基础知识的预备桥和割点.双联通分量.强连通分量,支配树.(并不会支配树) 关于有向图的Tarjan,是在熟悉不过的了,它的主要功能就是求强联通分量,缩个点,但是要注意一下构建新图的时候有可能出现重 ...
图->连通性->最小生成树(克鲁斯卡尔算法)
文字描述上一篇博客介绍了最小生成树(普里姆算法),知道了普里姆算法求最小生成树的时间复杂度为n^2, 就是说复杂度与顶点数无关,而与弧的数量没有关系: 而用克鲁斯卡尔(Kruskal)算法求最小生成 ...
Unity动态构建mesh绘制多边形算法流程分析和实践
前言先说一下,写这篇博文的动机,原文的博主代码写的十分潇洒,以至于代码说明和注释都没有,最近恰逢看到,所以以此博文来分析其中的算法和流程参考博文:https://blog.csdn.net/lin ...
并查集(Union-Find)算法介绍
原文链接:http://blog.csdn.net/dm_vincent/article/details/7655764 本文主要介绍解决动态连通性一类问题的一种算法,使用到了一种叫做并查集的数据结构 ...
Union-Find算法详解
今天讲讲 Union-Find 算法,也就是常说的并查集算法,主要是解决图论中「动态连通性」问题的.名词很高端,其实特别好理解,等会解释,另外这个算法的应用都非常有趣. 说起这个 Union-Find ...
Union-Find算法应用
上篇文章很多读者对于 Union-Find 算法的应用表示很感兴趣,这篇文章就拿几道 LeetCode 题目来讲讲这个算法的巧妙用法. 首先,复习一下,Union-Find 算法解决的是图的动态连通性 ...

随机推荐

外观模式(Facade)C++实现
外观模式意图: 为子系统中的一组接口提供一个一致的界面,此模式定义了一个高层接口,这个接口使得这一系统更加容易使用. 适用性: 1.在设计初期阶段,应该要有意识的将不同的两个层分离,比如经典的三层架 ...
洛谷P2455 [SDOI2006]线性方程组(高斯消元)
题目描述已知n元线性一次方程组. 其中:n<=50, 系数是[b][color=red]整数<=100(有负数),bi的值都是整数且<300(有负数)(特别感谢U14968 mmq ...
第五课： - Stack / Unstack / Transpose函数
第 5 课我们将简要介绍 stack 和 unstack 以及 T (Transpose)函数. 在用pandas进行数据重排时,经常用到stack和unstack两个函数.stack的意思是堆 ...
Android Toolbar使用及Fragment中的Toolbar处理
Toolbar作为ActionBar使用介绍本文介绍了在Android中将Toolbar作为ActionBar使用的方法.并且介绍了在Fragment和嵌套Fragment中使用Toolbar作为A ...
PCL：PCL可视化显示点云
(1):引用:仅仅是简单的显示点云,可以使用CloudViewer类.这个类非常简单易用.但要注意,它不是线程安全的.如果要用于多线程,还要参考PCLVisualizer. 需要注意的是,PointC ...
XML文件操作之dom4j
能够操作xml的api还是挺多的,DOM也是可以的,不过在此记录下dom4j的使用,感觉确实挺方便的所需jar包官网地址:http://www.dom4j.org/dom4j-1.6.1/ dom4 ...
eeee
Math Behind Rx https://github.com/ReactiveX/RxSwift/blob/master/Documentation/MathBehindRx.md Gettin ...
Python之进程进阶下
在python程序中的进程操作之前我们已经了解了很多进程相关的理论知识,了解进程是什么应该不再困难了,刚刚我们已经了解了,运行中的程序就是一个进程.所有的进程都是通过它的父进程来创建的.因此,运行起 ...
如何构建和设计以确保 API 的安全性
如何构建和设计以确保 API 的安全性面对常见的OWASP十大威胁.未经授权的访问.拒绝服务攻击.以及窃取机密数据等类型的攻击,企业需要使用通用的安全框架,来保护其REST API,并保证良好的用户 ...
Linux常用命令速查
索引表格命令功能简述目录与文件基本操作 pwd 显示当前目录 ls 列出目录和文件名称 cp 复制文件或目录 mv 移动或更名现有的文件或目录 rm 删除文件或目录 mkdir 新建目录 rmd ...

动态连通性问题：union-find算法

动态连通性问题：union-find算法的更多相关文章

随机推荐

热门专题