认识并查集

对于并查集(不相交集合)，很多人会感到很陌生，没听过或者不是特别了解。实际上并查集是一种挺高效的数据结构。实现简单，只是所有元素统一遵从一个规律所以让办事情的效率高效起来。

对于定意义，百科上这么定义的：

并查集，在一些有N个元素的集合应用问题中，我们通常是在开始时让每个元素构成一个单元素的集合，然后按一定顺序将属于同一组的元素所在的集合合并，其间要反复查找一个元素在哪个集合中。其特点是看似并不复杂，但数据量极大，若用正常的数据结构来描述的话，往往在空间上过大，计算机无法承受；即使在空间上勉强通过，运行的时间复杂度也极高，根本就不可能在比赛规定的运行时间（1～3秒）内计算出试题需要的结果，只能用并查集来描述。

并查集是一种树型的数据结构，用于处理一些不相交集合（Disjoint Sets）的合并及查询问题。常常在使用中以森林来表示。

并查集解析

基本思想

初始化，一个森林每个都为独立。通常用数组表示，每个值初始为-1。各自为根
join(a,b) 操作。a,b两个集合合并。注意这里的a，并不是a,b合并，而是a,b的集合合并。这就派生了一些情况：
a，b如果是独立的(没有和其他合并)，那么直接a指向b(或者b指向a)，即data[a]=b;同时为了表示这个集合有多少个，原本-1的b再次-1.即data[b]=-2.表示以b为父亲的节点有|-2|个。
a,b如果有集合(可能有父亲，可能自己是根)，那么我们当然不能直接操作a,b(因为a,b可能已经指向别人了.)那么我们只能操作a,b的祖先。因为a,b的祖先是没有指向的(即数据为负值表示大小)。那么他们首先一个负值要加到另外一个上面去。另外这个数值要变成指向的那个表示联系。

对于上述你可能会有疑问：

如何查看a,b是否在一个集合？

查看是否在一个集合，只需要查看节点根祖先的结果是否相同即可。因为只有根的数值是负的，而其他都是正数表示指向的元素。所以只需要一直寻找直到不为正数进行比较即可！

a,b合并，究竟是a的祖先合并在b的祖先上，还是b的祖先合并在a上？

这里会遇到两种情况，这个选择也是非常重要的。你要弄明白一点：树的高度+1的化那么整个元素查询的效率都会降低！

所以我们通常是：小数指向大树(或者低树指向高树)，这个使得查询效率能够增加！

当然，在高度和数量的选择上，还需要你自己选择和考虑。

其他路径压缩？

每次查询，自下向上。当我们调用递归的时候，可以顺便压缩路径，因为我们查找一个元素其实只需要直到它的祖先，所以当他距离祖先近那么下次查询就很快。并且压缩路径的代价并不大！

代码实现

并查集实现起来较为简单，直接贴代码！

package 并查集不想交集合;

import java.util.Scanner;

public class DisjointSet {

	static int tree[]=new int[100000];//假设有500个值

	public DisjointSet() 	{set(this.tree);}

	public DisjointSet(int tree[])

	{

		this.tree=tree;

		set(this.tree);

	}

	public void set(int a[])//初始化所有都是-1 有两个好处，这样他们指向-1说明是自己，第二，-1代表当前森林有-（-1）个

	{

		int l=a.length;

		for(int i=0;i<l;i++)

		{

			a[i]=-1;

		}

	}

	public int search(int a)//返回头节点的数值

	{

		if(tree[a]>0)//说明是子节点

		{

			return tree[a]=search(tree[a]);//路径压缩

		}

		else

			return a;

	}

	public int value(int a)//返回a所在树的大小（个数）

	{

		if(tree[a]>0)

		{

			return value(tree[a]);

		}

		else

			return -tree[a];

	}

	public void union(int a,int b)//表示 a，b所在的树合并

	{

		int a1=search(a);//a根

		int b1=search(b);//b根

		if(a1==b1) {System.out.println(a+"和"+b+"已经在一棵树上");}

		else {

		if(tree[a1]<tree[b1])//这个是负数，为了简单减少计算，不在调用value函数

		{

			tree[a1]+=tree[b1];//个数相加  注意是负数相加

			tree[b1]=a1;       //b树成为a的子树，直接指向a；

		}

		else

		{

			tree[b1]+=tree[a1];//个数相加  注意是负数相加

			tree[a1]=b1;       //b树成为a的子树，直接指向a；

		}

		}

	}

	public static void main(String[] args)

	{

		DisjointSet d=new DisjointSet();

		d.union(1,2);

		d.union(3,4);

		d.union(5,6);

		d.union(1,6);

		d.union(22,24);

		d.union(3,26);

		d.union(36,24);

		System.out.println(d.search(6));	//头

		System.out.println(d.value(6));     //大小

		System.out.println(d.search(22));	//头

		System.out.println(d.value(22));     //大小

	}

}

结语

并查集属于简单但是很高效率的数据结构。在集合中经常会遇到。如果不采用并查集而传统暴力效率太低，而不被采纳。
另外，并查集还广泛用于迷宫游戏中，下面有机会可以介绍用并查集实现一个走迷宫小游戏。大家欢迎关注！
最后，欢迎大家关注笔者公众号，一起学习、交流！笔者学习资源也放置公众号和大家一起分享！

并查集(不相交集合)详解与java实现的更多相关文章

poj1417 true liars（并查集 + DP）详解
这个题做了两天了.首先用并查集分类是明白的, 不过判断是否情况唯一刚开始用的是搜索.总是超时. 后来看别人的结题报告, 才恍然大悟判断唯一得用DP. 题目大意: 一共有p1+p2个人,分成两组,一组p ...
Java集合详解1：一文读懂ArrayList,Vector与Stack使用方法和实现原理
本文非常详尽地介绍了Java中的三个集合类 ArrayList,Vector与Stack <Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整 ...
Solr系列二：solr-部署详解（solr两种部署模式介绍、独立服务器模式详解、SolrCloud分布式集群模式详解）
一.solr两种部署模式介绍 Standalone Server 独立服务器模式:适用于数据规模不大的场景 SolrCloud 分布式集群模式:适用于数据规模大,高可靠.高可用.高并发的场景二.独 ...
Java集合详解6：TreeMap和红黑树
Java集合详解6:TreeMap和红黑树初识TreeMap 之前的文章讲解了两种Map,分别是HashMap与LinkedHashMap,它们保证了以O(1)的时间复杂度进行增.删.改.查,从存储 ...
Java集合详解8：Java集合类细节精讲，细节决定成败
<Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查 ...
Java集合详解7：一文搞清楚HashSet，TreeSet与LinkedHashSet的异同
<Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查 ...
Java集合详解6：这次，从头到尾带你解读Java中的红黑树
<Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查 ...
Java集合详解4：一文读懂HashMap和HashTable的区别以及常见面试题
<Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查 ...
Java集合详解3：一文读懂Iterator，fail-fast机制与比较器
<Java集合详解系列>是我在完成夯实Java基础篇的系列博客后准备开始写的新系列. 这些文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查 ...

随机推荐

C#3.0新增功能10 表达式树 05 解释表达式
连载目录 [已更新最新开发文章,点击查看详细] 表达式树中的每个节点将是派生自 Expression 的类的对象. 该设计使得访问表达式树中的所有节点成为相对直接的递归操作. 常规策略是从根节点 ...
python 之并发编程（线程理论，开启线程的两种方式，进程与线程的区别，线程对象的其他方法）
9.9 线程理论 1.什么是线程线程指的是一条流水线的工作过程进程根本就不是一个执行单位,进程其实是一个资源单位,一个进程内自带一个线程,线程才是执行单位 2.进程VS线程同一进程内的线程们共享 ...
Java EE.Servlet.处理请求
Servlet的核心工作便是处理客户端提交的请求信息,生成动态响应信息返回客户端. 1.请求参数 POST方法一般用于更新服务器上的资源,当时用POST方法时,提交的数据包含在HTTP实体内,而GET ...
基于 HTML5 Canvas 的可交互旋钮组件
前言此次的 Demo 效果如下: Demo 链接:https://hightopo.com/demo/comp-knob/ 整体思路组件参数绘制旋钮绘制刻度绘制指针绘制标尺绘制文本 1. ...
【iOS】Your account already has a valid ios
打包内测的时候遇到了这个问题,如图所示: 官网解决办法: If the certificate already exists in Member Center, a “Your account alr ...
Ping、Traceroute工作原理
在工作开发过程中,我们经常会使用到ping和traceroute.在这里,我们将细述其工作原理,让你在会用的基础之上理解其内部工作过程. ICMP应用实例--Ping Ping 是 ICMP 的一个重 ...
学好C/C++编程，走遍天下都不怕
C++这门语言从诞生到今天已经经历了将近30个年头.不可否认,它的学习难度都比其它语言较高.而它的学习难度,主要来自于它的复杂性.现在C++的使用范围比以前已经少了很多,java.C#.python等 ...
干货 |《从Lucene到Elasticsearch全文检索实战》拆解实践
1.题记 2018年3月初,萌生了一个想法:对Elasticsearch相关的技术书籍做拆解阅读,该想法源自非计算机领域红火已久的[樊登读书会].得到的每天听本书.XX拆书帮等. 目前市面上Elast ...
Vue系列：Slot 插槽的使用范例
插槽对于自定义的组件开发来说,是十分强大的功能.这篇主要做个简单梳理插槽可以分3种: 1.简单插槽 2.具名插槽 3.作用域插槽
基于 kubeadm 部署单控制平面的 k8s 集群
单控制平面不符合 HA 要求,但用于开发/测试环境不会有任何问题,如果资源足够的话(10台以上服务器,3台用于APIserver.3台用于 etcd 存储.至少3台用于工作节点.1台作为负载均衡),可 ...

并查集(不相交集合)详解与java实现