总结HashSet以及分析部分底层源码

1. HashSet继承的抽象类和实现的接口

继承的抽象类：AbstractSet
实现了Set接口
实现了Cloneable接口
实现了Serializable序列化接口：该接口标记此类支持序列化操作

2. HashSet底层数据结构

HashSet底层是基于HashMap实现的，HashMap底层数据结构是基于数组+链表实现的。

1. 特点

既保存了数组查询和修改元素效率快的优点，也保存了链表在添加和删除元素时效率快的特点。
存储的元素是无序的，不允许重复的，存储的元素最多只能有一个为null值，这是因为HashSet底层存储元素时只是利用了HashMap的key来存储元素，而HashMap的value都是存储的一个new Object() 对象。所以说HashSet只是利用了HashMap的key，并没有利用HashMap的value。

2. HashSet的底层结构图

因为HashSet底层是使用的HashMap，所以下图实际上是HashMap的底层数据结构。当存储一个元素时，首先会给这个元素计算一个hash值。然后根据计算出来的hash值决定将元素存储到哈希表中的那个位置。

3. 优点

存取效率高，可以动态扩容

4. 缺点

每次存储新的元素都需要计算一次hashCode值，如果计算hash值的算法设计的不好，哈希碰撞产生过多，就可能造成一个节点小存储了多个元素，而哈希表中相邻的元素的位置没有存储任何元素。
HashSet线程不安全，在多线程情况下会出现线程安全问题。

3. HashSet适用的场景

需要存储不重复的值，要求存取效率高，适合在单线程情况下使用。
如果需要在多线程情况下使用，需要使用Collections集合工具类，创建一个线程安全的HashSet集合
```
Set<Integer> hashSet = Collections.synchronizedSet(new HashSet<Integer>());
```

4. HashSet底层源码分析

1. 构造函数

1. 默认无参构造函数

/**

 * 默认无参构造函数

 */

public HashSet() {

	map = new HashMap<>();

}

2. 传递一个集合的构造函数

/**

 * 可以将集合中的数据全部添加到新创建的HashSet集合中，会去除掉重复的值。

 * @param  c

 */

public HashSet(Collection<? extends E> c) {

    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));

    addAll(c);

}

2. 添加一个元素的流程

1. 将数据包装

在每次添加数据时，如果数据是基本数据类型，会先将基本数据类型进行装箱操作，把基本数据类型转换成对应的包装类型（引用数据类型）

// 例如：集合中存放Integer数据类型，在进行add操作时，会先进行装箱操作

/**

 * 将基本数据类转换为引用数据类型

 * @param  i 	传入的参数为一个基本型数据类型

 * @return 		返回的参数是一个基本数据类型的包装类（引用数据类型）

 */

public static Integer valueOf(int i) {

    if (i >= IntegerCache.low && i <= IntegerCache.high)

        return IntegerCache.cache[i + (-IntegerCache.low)];

    return new Integer(i);

}

2. 调用add() 方法

/**

 * HashSet的添加方法

 * @param  i 	传入需要添加的元素

 * @return 		添加成功返回true，失败返回false

 */

public boolean add(E e) {

    // 直接调用已经创建好的HashMap集合，调用HashMap中的put()方法进行添加，key为元素值，value为常量对象

    return map.put(e, PRESENT)==null;

}

常量说明

// 该常量对象将作为HashSet集合的value

private static final Object PRESENT = new Object();

3. HashMap中的put()方法

/**

 * HashMap的put添加方法

 * @param key    对应的是HashSet要添加的元素

 * @param value  对应的是一个常量对象 new Object()

 * @return       添加成功返回null，添加失败返回value值

 */

public V put(K key, V value) {

    // 调用putVal()方法，对元素进行添加

    return putVal(hash(key), key, value, false, true);

}

4. HashMap中的hash()方法

/**

 * HashMap的hash方法，用于计算每个key的hash值，这个hash值将决定key在哈希表中的具体位置

 * @param key    对应的是HashSet要添加的元素

 * @return       返回根据key计算出来的hash值

 */

static final int hash(Object key) {

    // 用于接收计算好的hash值

    int h;

    // 返回根据key计算出来的hash值

    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

}

5. HashMap中putVal()方法

/**

 * HashMap的hash方法，用于计算每个key的hash值，这个hash值将决定key在哈希表中的具体位置

 * @param hash    		计算好的hash值

 * @param value    		需要存储的key值

 * @param onlyIfAbsent   需要存储的value值

 * @param onlyIfAbsent   如果返回true说明添加的key是首次添加，false说明是修改了对应key的value

 * @param evict    		目前HashMap并没有使用改变了，留给了实现HashMap的子类

 * @return

 */

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {

    // 创建一个类型为Node的数组，其实就是哈希表

    Node<K,V>[] tab;

    //

    Node<K,V> p;

    // 辅助n，记录tab的长度。辅助变量i，存储经过计算得到的tab表的下标值

    int n, i;

    // 判读tab表是否为空，或者长度为0，满足则说明是第一次创建tab表

    if ((tab = table) == null || (n = tab.length) == 0)

        n = (tab = resize()).length;    	      // 为tab表创建初始大小16，赋给辅助变量n

    // 将tab表长度减一在和hash进行按位与运算，得到一个tab表的下标值，赋给i，

    // 再将当前下标所指向的tab表的对象赋给p，判断当前位置上是否存储对象，即是否为null

    if ((p = tab[i = (n - 1) & hash]) == null)

        tab[i] = newNode(hash, key, value, null);  // 如果当前位置为null，直接添加一个新节点 

    // 如果当前位置已经存储过节点

    else {

        // 创建一个节点对象e

        Node<K,V> e;

        // 创建一个与key相同类型的变量k

        K k;	

        /*

        	如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样,

        	并且满足下面两个条件之一:

        	(1)准备加入的key和p指向的Node结点的key是同一个对象

        	(2)p指向的Node结点的key的equals()和准备加入的key比较后相同

        */

        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))

            e = p;

        // 判断p是不是红黑树的一个节点对象

        else if (p instanceof TreeNode)

            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);	// 作为节点添加到红黑树

        // 如果table对应索引位置，已经是一个链表,就使用for循环比较

        else {

            /*

            	1. 依次和该链表的每一个元素比较后，都不相同,则加入到该链表的最后

 	               注意在把元素添加到链表后，立即判断该链表是否已经达到8个结点,

 	               达到8个节点数就调用treeifyBin()对当前这个链表进行树化(转成红黑树)

 	               注意：

                       if(tab==null||(n=tab.length)<MIN_TREEIFY_CAPACITY(64))

                            resize();

 	               如果上面条件成立，先table扩容，只有上面条件不成立时，才进行转成红黑树

            */

            for (int binCount = 0; ; ++binCount) {

                if ((e = p.next) == null) {

                    p.next = newNode(hash, key, value, null);

                    if (binCount >= TREEIFY_THRESHOLD - 1)

                        treeifyBin(tab, hash);

                    break;

                }

                // 2. 依次和该链表的每一个元素比较过程中，如果有key相同情况,就直接break

                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                    break;

                // 将对应位置上的节点

                p = e;

            }

        }

        if (e != null) {

            V oldValue = e.value;

            if (!onlyIfAbsent || oldValue == null)

                e.value = value;

            afterNodeAccess(e);

            return oldValue;

        }

    }

    // 记录集合被修改的次数

    ++modCount;

    // 判断当前哈希表中实际存储的元素个数是否得到扩容条件，threshold的大小为哈希表长度的0.75（默认值）

    if (++size > threshold)

        resize();				// 调用扩容方法

    afterNodeInsertion(evict);   // 该方法在HashMap中没有实际作用，是留给HashMap的子类的

    return null;			    // 添加节点元素成功，返回null

}

总结HashSet以及分析部分底层源码的更多相关文章

List-LinkedList、set集合基础增强底层源码分析
List-LinkedList 作者 : Stanley 罗昊 [转载请注明出处和署名,谢谢!] 继上一章继续讲解,上章内容: List-ArreyLlist集合基础增强底层源码分析:https:// ...
Java泛型底层源码解析-ArrayList,LinkedList,HashSet和HashMap
声明:以下源代码使用的都是基于JDK1.8_112版本 1. ArrayList源码解析 <1. 集合中存放的依然是对象的引用而不是对象本身,且无法放置原生数据类型,我们需要使用原生数据类型的包 ...
List-ArrayList集合基础增强底层源码分析
List集合基础增强底层源码分析作者:Stanley 罗昊 [转载请注明出处和署名,谢谢!] 集合分为三个系列,分别为:List.set.map List系列特点:元素有序可重复有序指的是元素的 ...
2018.11.20 Struts2中对结果处理方式分析&struts2内置的方式底层源码剖析
介绍一下struts2内置帮我们封装好的处理结果方式也就是底层源码分析这是我们的jar包里面找的位置目录打开往下拉看到result-type节点 name那一列就是我们的type类型取值上一篇博 ...
BAT资深工程师由浅入深分析 Tp5&Tp6底层源码 - 分享
BAT资深工程师由浅入深分析Tp5&Tp6底层源码第1章课程简介本章主要让大家知道本套课程的主线, 导学内容,如何学习源码等,看完本章要让小伙伴觉得这个是必须要掌握的,并且对加薪有很大的 ...
BAT资深工程师由浅入深分析Tp5&Tp6底层源码☆
第1章课程简介本章主要让大家知道本套课程的主线, 导学内容,如何学习源码等,看完本章要让小伙伴觉得这个是必须要掌握的,并且对加薪有很大的帮助. 第2章 [TP5灵魂]自动加载Loader 深度分析 ...
LInkedList总结及部分底层源码分析
LInkedList总结及部分底层源码分析 1. LinkedList的实现与继承关系继承:AbstractSequentialList 抽象类实现:List 接口实现:Deque 接口实现: ...
Vector总结及部分底层源码分析
Vector总结及部分底层源码分析 1. Vector继承的抽象类和实现的接口 Vector类实现的接口 List接口:里面定义了List集合的基本接口,Vector进行了实现 RandomAcces ...
从底层源码浅析Mybatis的SqlSessionFactory初始化过程
目录搭建源码环境 POM依赖测试SQL Mybatis全局配置文件 UserMapper接口 UserMapper配置 User实体 Main方法快速进入Debug跟踪源码分析准备源码分析 ...

随机推荐

Linux线程互斥学习笔记--详细分析
一.互斥锁为啥要有互斥? 多个进程/线程执行的先后顺序不确定,何时切出CPU也不确定. 多个进程/线程访问变量的动作往往不是原子的. 1. 操作步骤 (1)创建锁 // 创建互斥锁mutex pth ...
linux 蓝牙开发调试（rtl8821cs模块）
刚调完rtl8821cs的wifi功能,项目需要打通蓝牙配网功能. 调试过程中遇到各种问题中间几乎放弃,倒腾了几天最后还是打通了,顺便记录下过程. 通信接口:SDIO @WiFi.Uart @BT;工 ...
Python import urllib2 ImportError: No module named 'urllib2'
python3 import urllib2 import urllib2 ImportError: No module named 'urllib2' python3.3里面,用urllib.req ...
JAVA笔记5__构造块、静态块/单例设计模式/继承/final关键字/super关键字
public class Main { { //构造块(在构造对象时调用,先于构造方法执行) System.out.println("我是构造块!"); } static{ //静 ...
PWN学习之格式化字符串漏洞
目录 PWN学习之格式化字符串漏洞格式化输出函数格式化字符串漏洞漏洞利用使程序崩溃栈数据泄露任意地址内存泄漏栈数据覆盖任意地址内存覆盖 PWN学习之格式化字符串漏洞格式化输出函数可 ...
通过silky框架在.net平台构建微服务应用
目录必要前提使用Web主机构建微服务应用使用.NET通用主机构建微服务应用构建具有websocket服务能力的微服务应用构建Silky微服务网关开源地址在线文档在线示例必要前提 (必 ...
Centos7下安装BlockScout
简介 BlockScout是一个Elixir应用程序,允许用户搜索以太坊网络(包括所有叉子和侧链)上的交易,查看账户和余额以及验证智能合约.BlockScout为用户提供了一个全面,易于使用的界面,以 ...
vue + cesium开发(4) 绘制图形
在官方例子中每个图形都是一个entity,官方例子提供了显示正方形.圆形.锥形.图片等多种案例! // 初始花 var viewer = new Cesium.Viewer("cesiumC ...
nginx 支持websocket
nginx 反向代理websocket nginx配置请求地址及路径:ws://x.x.x.x/web/springws/websocket.ws 解析 map 指令上面 nginx.conf 配 ...
[noi1779]D
先离散,然后将黑的看成1,白的看成-1,对整个序列差分,所有区间建为$(l,r+1)$的无向边,并标上-1和1,每一个点的前缀和即为该点的值考虑什么情况下能够使得所有点都是0:当且仅当每一个点的度数 ...

总结HashSet以及分析部分底层源码

总结HashSet以及分析部分底层源码

1. HashSet继承的抽象类和实现的接口

2. HashSet底层数据结构

1. 特点

2. HashSet的底层结构图

3. 优点

4. 缺点

3. HashSet适用的场景

4. HashSet底层源码分析

1. 构造函数

1. 默认无参构造函数

2. 传递一个集合的构造函数

2. 添加一个元素的流程

1. 将数据包装

2. 调用add() 方法

3. HashMap中的put()方法

4. HashMap中的hash()方法

5. HashMap中putVal()方法

总结HashSet以及分析部分底层源码的更多相关文章

随机推荐

热门专题