WiKi

Disjoint是“不相交”的意思。Disjoint Set高效地支持集合的合并（Union）和集合内元素的查找（Find）两种操作，所以Disjoint Set中文翻译为并查集。

就《算法导论》21章来讲，主要设计这几个知识点：

 用并查集计算图的连通区域；

 推断两个顶点是否属于同一个连通区域；

 链表实现并查集；

 Rooted tree实现并查集；

 Rooted tree实现并查集时採用rank方法和路径压缩算法。

《算法导论》21.4给出了一个结论：总计m个MAKE-SET、UNION、FIND-SET操作。当中MAKE-SET的个数为n，则採用rank和路径压缩算法实现的并查集最坏时间复杂度是O(m α(n) )。当中α是Ackerman函数的某个反函数，这个函数的值能够看成是不大于4。所以，并查集的三种典型操作的时间复杂度是线性的。

并查集的java实现

这里依据《算法导论》的21.3节的伪代码，实现了一个泛型的并查集。输出时，打印节点及其集合的代表元素（即根元素。representative）。

import java.util.ArrayList;

import java.util.List;

import java.util.TreeSet;

/**

 * <p>并查集的实现<p/>

 * <p>參考：《算法导论》21.3节<p/>

 * <p>created by 曹艳丰<p/>

 * <p>2016-08-31<p/>

 *

 * */

public class DisjointSet<T> {

    private List<Node> forests;//全部节点

    public DisjointSet(){

        forests=new ArrayList<Node>();

    }

    /**

     * 内部类，并查集的rooted node

     * */

    private class Node{

        Node parent;

        int rank;

        T t;

        private Node(T t){

            parent=this;

            rank=0;

            this.t=t;

        }

    }

    //向森林中加入节点

    public void makeSet(T t){

        Node node=new Node(t);

        forests.add(node);

    }

    //将包括x和包括y的两个集合进行合并

    public void union(T x,T y){

        Node xNode=isContain(x);

        Node yNode=isContain(y);

        if (xNode!=null&&yNode!=null) {

            link(findSet(xNode), findSet(yNode));

        }

    }

    //查找到节点node的根节点

    public Node findSet(Node node){

        if (node!=node.parent) {

            //路径压缩，參考《算法导论》插图21.5

            node.parent=findSet(node.parent);

        }

        return node.parent;

    }

    //查找到节点node的根节点

        public Node findSet(T t){

            Node node=isContain(t);

            if (node==null) {

                throw new IllegalArgumentException("不含该节点！

");

            }else {

                return findSet(node);

            }

        }

    //将两个根节点代表的集合进行连接

    private void link(Node xNode,Node yNode){

        if (xNode.rank>yNode.rank) {

            yNode.parent=xNode;

        }else {

            xNode.parent=yNode;

            if (xNode.rank==yNode.rank) {

                yNode.rank+=1;

            }

        }

    }

    //森林是否包括这个节点

    private Node isContain(T t){

        for (Node node : forests) {

            if (node.t.equals(t)) {

                return node;

            }

        }

        return null;

    }

    @Override

    public String toString() {

        // TODO Auto-generated method stub

        if (forests.size()==0) {

            return "并查集为空！";

        }

        StringBuilder builder=new StringBuilder();

        for (Node node : forests) {

            Node root=findSet(node);

            builder.append(node.t).append("→").append(root.t);

            builder.append("\n");

        }

        return builder.toString();

    }

}

然后測试一下

public class Main{

    public static void main(String[] args) {

        // TODO Auto-generated method stub

        DisjointSet<String> disjointSet=new DisjointSet<String>();

        disjointSet.makeSet("cao");

        disjointSet.makeSet("yan");

        disjointSet.makeSet("feng");

        disjointSet.union("cao", "yan");

        disjointSet.union("cao", "feng");

        System.out.println(disjointSet.toString());

    }

}

输出格式，元素→代表元素

cao→yan

yan→yan

feng→yan

表明3个节点的代表元素一致。即处于一个集合中。

图的连通区域计算`

《算法导论》21.1节的伪代码。这里给出连通区域计算的样例。图的数据结构採用“【算法导论-35】图算法JGraphT开源库介绍 “中的无向图。

private static void connectedComponents(){

        UndirectedGraph<String, DefaultEdge> g =

                new SimpleGraph<>(DefaultEdge.class);

        String v1 = "v1";

        String v2 = "v2";

        String v3 = "v3";

        String v4 = "v4";

        // add the vertices

        g.addVertex(v1);

        g.addVertex(v2);

        g.addVertex(v3);

        g.addVertex(v4);

        // add edges to create a circuit

        g.addEdge(v1, v2);

        g.addEdge(v2, v3);

        //连通区域计算

        //參考《算法导论》21.1节

        DisjointSet<String> disjointSet=new DisjointSet<String>();

        for ( String v : g.vertexSet()) {

            disjointSet.makeSet(v);

        }

//        for ( DefaultEdge e : g.edgeSet()) {

//          String source=e.getSource();//protected訪问类型

//          String target=e.getTarget();//protected訪问类型

//          if (disjointSet.findSet(source)!=disjointSet.findSet(target)) {

//              disjointSet.union(source, target);

//          }

//      }

        if (disjointSet.findSet(v1)!=disjointSet.findSet(v2)) {

            disjointSet.union(v1, v2);

        }

        if (disjointSet.findSet(v2)!=disjointSet.findSet(v3)) {

            disjointSet.union(v2, v3);

        }

        System.out.println(disjointSet.getSetCounter());

    }

输出

v1→v2

v2→v2

v3→v2

v4→v4

v1、v2、v3的代表元素一致。表明三者在一个集合中，即三者连通。

v4是另外一个集合。

实例应用

举个样例，某人结婚时宴请宾客，A来宾认识B来宾，B来宾认识C来宾，则A、B、C安排在一桌。

A来宾认识B来宾，且A、B的熟人及其熟人的熟人（熟人链）不包括C，则C与A、B不在一桌。问。须要多少桌子才干满足要求呢？

这个样例事实上就是连通区域的详细到社交关系的1度、2度……n度关系。

略微改动并查集的实例，加入集合的计数setCounter，每次makeset时递增，union时递减。这样就得到最后的集合个数。

import java.util.ArrayList;

import java.util.List;

import java.util.TreeSet;

/**

 * <p>并查集的实现<p/>

 * <p>參考：《算法导论》21.3节<p/>

 * <p>created by 曹艳丰<p/>

 * <p>2016-08-31<p/>

 *

 * */

public class DisjointSet<T> {

    private List<Node> forests;//全部节点

    private int setCounter;//集合计数

    public DisjointSet(){

        forests=new ArrayList<Node>();

        setCounter=0;

    }

    public int getSetCounter() {

        return setCounter;

    }

    /**

     * 内部类，并查集的rooted node

     * */

    private class Node{

        Node parent;

        int rank;

        T t;

        private Node(T t){

            parent=this;

            rank=0;

            this.t=t;

        }

    }

    //向森林中加入节点

    public void makeSet(T t){

        Node node=new Node(t);

        forests.add(node);

        setCounter++;

    }

    //将包括x和包括y的两个集合进行合并

    public void union(T x,T y){

        if (x.equals(y)) {

            throw new IllegalArgumentException("Union的两个元素不能相等。");

        }

        Node xNode=isContain(x);

        Node yNode=isContain(y);

        if (xNode!=null&&yNode!=null) {

            link(findSet(xNode), findSet(yNode));

            setCounter--;

        }

    }

    //查找到节点node的根节点

    public Node findSet(Node node){

        if (node!=node.parent) {

            //路径压缩，參考《算法导论》插图21.5

            node.parent=findSet(node.parent);

        }

        return node.parent;

    }

    //查找到节点node的根节点

        public Node findSet(T t){

            Node node=isContain(t);

            if (node==null) {

                throw new IllegalArgumentException("不含该节点！

");

            }else {

                return findSet(node);

            }

        }

    //将两个根节点代表的集合进行连接

    private void link(Node xNode,Node yNode){

        if (xNode.rank>yNode.rank) {

            yNode.parent=xNode;

        }else {

            xNode.parent=yNode;

            if (xNode.rank==yNode.rank) {

                yNode.rank+=1;

            }

        }

    }

    //森林是否包括这个节点

    private Node isContain(T t){

        for (Node node : forests) {

            if (node.t.equals(t)) {

                return node;

            }

        }

        return null;

    }

    @Override

    public String toString() {

        // TODO Auto-generated method stub

        if (forests.size()==0) {

            return "并查集为空！";

        }

        StringBuilder builder=new StringBuilder();

        for (Node node : forests) {

            Node root=findSet(node);

            builder.append(node.t).append("→").append(root.t);

            builder.append("\n");

        }

        return builder.toString();

    }

}

连通区域的计算，只是这里输出的是集合个数。

private static void connectedComponents(){

        UndirectedGraph<String, DefaultEdge> g =

                new SimpleGraph<>(DefaultEdge.class);

        String v1 = "v1";

        String v2 = "v2";

        String v3 = "v3";

        String v4 = "v4";

        // add the vertices

        g.addVertex(v1);

        g.addVertex(v2);

        g.addVertex(v3);

        g.addVertex(v4);

        // add edges to create a circuit

        g.addEdge(v1, v2);

        g.addEdge(v2, v3);

        //连通区域计算

        //參考《算法导论》21.1节

        DisjointSet<String> disjointSet=new DisjointSet<String>();

        for ( String v : g.vertexSet()) {

            disjointSet.makeSet(v);

        }

//        for ( DefaultEdge e : g.edgeSet()) {

//          String source=e.getSource();//protected訪问类型

//          String target=e.getTarget();//protected訪问类型

//          if (disjointSet.findSet(source)!=disjointSet.findSet(target)) {

//              disjointSet.union(source, target);

//          }

//      }

        if (disjointSet.findSet(v1)!=disjointSet.findSet(v2)) {

            disjointSet.union(v1, v2);

        }

        if (disjointSet.findSet(v2)!=disjointSet.findSet(v3)) {

            disjointSet.union(v2, v3);

        }

        System.out.println(disjointSet.getSetCounter());

    }

输出是2。

【算法导论-36】并查集(Disjoint Set)具体解释的更多相关文章

【算法与数据结构】并查集 Disjoint Set
并查集(Disjoint Set)用来判断已有的数据是否构成环. 在构造图的最小生成树(Minimum Spanning Tree)时,如果采用 Kruskal 算法,每次添加最短路径前,需要先用并查 ...
并查集(Disjoint Set)
在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中.这一类问题其特点是看似并不复杂, ...
【数据结构】【计算机视觉】并查集(disjoint set)结构介绍
1.简述在实现多图像无序输入的拼接中,我们先使用surf算法对任意两幅图像进行特征点匹配,每对图像的匹配都有一个置信度confidence参数,来衡量两幅图匹配的可信度,当confidence> ...
hdu 4641 K-string SAM的O(n^2)算法以及 SAM+并查集优化
链接:http://acm.hdu.edu.cn/showproblem.php?pid=4641 题意:有一个长度为n(n < 5e4)的字符串,Q(Q<=2e5)次操作:操作分为:在末 ...
hdu 1233(还是畅通project)（prime算法，克鲁斯卡尔算法）（并查集，最小生成树）
还是畅通project Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Tota ...
POJ 2421 Constructing Roads (Kruskal算法+压缩路径并查集 )
Constructing Roads Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 19884 Accepted: 83 ...
hdu 4641K-string SAM的O(n^2)算法以及 SAM+并查集优化
转载:http://www.cnblogs.com/hxer/p/5675149.html 题意:有一个长度为n(n < 5e4)的字符串,Q(Q<=2e5)次操作:操作分为:在末尾插入一 ...
距离LCA离线算法Tarjan + dfs + 并查集
距离B - Distance in the Tree 还是普通的LCA但是要求的是两个节点之间的距离,学到了一些一开始我想用带权并查集进行优化,但是LCA合并的过程晚于离线计算的过程,所以路径长度会 ...
并查集(Disjoint Set Union,DSU)
定义: 并查集是一种用来管理元素分组情况的数据结构. 作用: 查询元素a和元素b是否属于同一组合并元素a和元素b所在的组优化方法: 1.路径压缩 2.添加高度属性拓展延伸: 分组并查集带权并查 ...

随机推荐

MySQL改变表的存储引擎
MySQL提供了多种数据库存储引擎,存储引擎负责MySQL数据库中的数据的存储和提取.不同的存储引擎具有不同的特性,有时可能须要将一个已经存在的表的存储引擎转换成另外的一个存储引擎.有非常多方法能够完 ...
SPSS提示“列表中不同意存在字符串变量”的解决方法
今天用SPSS对一些数据进行主成分分析,SPSS 19.0进行主成分分析的方法是:分析--降维--因子分析,可是当导入一些变量的时候.就会弹出窗体说"列表中不同意存在字符串变量", ...
OCP将结束容器产业这个颠覆性产业的标准格式之争
编者注:本文英文版来自VentureBeat,中文版由天地会珠海分舵编译.当以Docker为首的容器正在席卷全球.蔚然成风的颠覆着原来的应用开发和公布方式的时候,容器标准之争却从来没有消停过.而标准之 ...
Java源代码之集合框架（图）
百度"java 集合"图时.搜出来一张图.图蛮不错的.跟大家分享下.
POJ 2533 Longest Ordered Subsequence（dp LIS）
Language: Default Longest Ordered Subsequence Time Limit: 2000MS Memory Limit: 65536K Total Submis ...
apicloud中的sqlite操作模块db
db 模块封装了手机常用数据库 sqlite 的增删改查语句,可实现数据的本地存储,极大的简化了数据持久化问题. 1.执行 var db = api.require('db'); db.execute ...
NOI2017整数
NOI2017 整数题意: 让你实现两个操作: 1 \(a\) \(b\):将\(x\)加上整数\(a \cdot 2 ^ b\),其中 \(a\)为一个整数,\(b\)为一个非负整数 2 \( ...
OpenGL核心技术之混合技术
笔者介绍:姜雪伟,IT公司技术合伙人,IT高级讲师,CSDN社区专家,特邀编辑,畅销书作者.国家专利发明人;已出版书籍:<手把手教你架构3D游戏引擎>电子工业出版社和<Unity3D ...
实战c++中的vector系列--copy set to vector(别混淆了reserve和resize)
stl算法中有个copy函数.我们能够轻松的写出这种代码: #include <iostream> #include <algorithm> #include <vect ...
根证书 CA
根证书 CA 密钥没有密码,使用下面的指令添加密码 openssl rsa -aes256 -in cakey_nopw.pem -out cakey_pw.pem cacert.pem -----B ...

【算法导论-36】并查集(Disjoint Set)具体解释