从JDK源码学习HashSet和HashTable
HashSet
Java中的集合(Collection)有三类,一类是List,一类是Queue,再有一类就是Set。 前两个集合内的元素是有序的,元素可以重复;最后一个集合内的元素无序,但元素不可重复。
Set:
1.用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复
2.对象的相等性本质是对象hashCode值(java是依据对象的内存地址计算出的此序号,不同对象的hashcode不一定不一样)判断的,如果想要让两个不同的对象视为相等的,就必须覆盖Object的hashCode方法和equals方法,比如string类就重写了hashcode方法,算出的hashcode值并不是对象的实际内存地址,equals也被重写了
String.hashcode()

String.equals
1.先验证是否是否是同一个对象
2.再验证是否是同一类型(String),然后验证值是否相等

Hashset也是支持序列化、浅拷贝的

Hashset内部还是Hashset,只不过调用它的add直接放入的不再是键值对
看下其add方法:
直接调用map.put放入e所代表的的键以及present成员变量

而这里的map就是hashset内部存储值的结构,可以看到其键是放入的,键所对应的值是object的实例

既然其用的hashmap,那么其构造方法实际上就是定义hashmap,所以就是hashmap的那四种构造方法
那么取值的时候不像hashmap那么方便可以直接取某个键对应的值,取hashset中的值是获得一个迭代器,取得内部hashmap所有的键然后遍历再进行操作

所以其内部存储时结构也和hashmap结构一样了,同时hashset也是非线程安全的
ArrayList和HashSet的区别
1.前者有序,可存放重复值,后者无序,不可存放重复值,因为hashmap键不能重复
2.Arraylist被填满扩充1.5倍,Hashset扩充机制和hashmap相同
HashTable
HashTable实现的map接口,支持序列化和浅拷贝

hashtable也是"拉链法"实现的hash表(只是数组加单链表),其内部存储结构为entry数组,和hashmap类似,其也有负载因子和初始容量
其构造方法也有4种
第一种如下支持初始指定容量和负载因子,此时将给entry分配内存空间,并且初始化阈值为初始容量和(2的31次-1)-8(最大值字节数)+1的较小值

第二种只指定初始化大小

第三种使用默认初始容量和负载因子,初始容量为11

第四种则是直接放入一个map进来初始化构造一个hashtable,此时的hashtable容量将变为放入的map的键值对的个数的2倍和默认容量的较大值,然后再将map放入

而hashmap这里是和hashtable不一样的,初始化时将用放入的map的键值数量/负载因子+0.75,算出的值再和2的30次方做比较,取两者较小值和阈值进行比较,并赋值阈值为大于算出值最接近的2的次方值,便于后面resize扩容,然后后面再通过循坏将map中的值依次放入

HashTable和HashMap的比较
1.HashTable 基于 Dictionary 类,而 HashMap 是基于 AbstractMap。Dictionary 是任何可将键映射到相应值的类的抽象父类, AbstractMap 是基于 Map 接口的实现,但hashtable和hashmap二者都实现了Map接口
2.hashmap可以放键和值均为null的值,但是这样的值你也只能放一个进去,所以hashmap中判断是否存在某个键要用containskey(键必定是唯一的),而不能用get,因此能有多个键对应的value都是null,而hashtable的键和值不可以为null,否则将会报空指针错误
hashmap的处理:

所以hashmap考虑到了这种key为null的情况,让其hash算出来为0,不为null的key再调用object的hashcode方法算hash
hashmap的get方法如下图,不存在也有可能返回null或者键的值为null,无法判断

hashtable的处理:
hashtable的设计并没有考虑这么多,而是直接调用其key的hashcode,那么null.hashcode,必将报错

hashtable将检测放入的键对应的值是否为null

3.hashmap在默认情况下是非线程安全的,而hashtable以为基本public方法都是用synchronized修饰的,因此其为同步的
4.两者的扩容方式不一样,hashmap扩容是resize方法,容量变为old*2,而hashtable是rehash方法,容量变为old*2+1,

5.两者内部遍历实现不一样:
hashmap的键值遍历为iterator

hashtable的键值遍历为Enumerator

6.获取键所在的位置时的方法不同:
hashmap中首先用与逻辑代替了模运算加快了速度,2的n次方-1位全1二进制位再与key的hash与算出键值对的位置,并且其hash值并不是单纯的hashcode,而是用到了key的hashcode的高16位来做异或运算


hashtable中是根据key直接算一个hashcode(可能为负值),然后再和2的31次方-1做与算出来的正值再模当前hash表的长度,然后确定键值对的位置,那么取模的效率肯定没有与逻辑的运行效率更高

参考
https://blog.csdn.net/fujiakai/article/details/51585767 hashmap和hashtable区别
https://wiki.jikexueyuan.com/project/java-collection/hashtable.html hashmap实现原理
从JDK源码学习HashSet和HashTable的更多相关文章
- JDK源码学习--String篇(二) 关于String采用final修饰的思考
JDK源码学习String篇中,有一处错误,String类用final[不能被改变的]修饰,而我却写成静态的,感谢CTO-淼淼的指正. 风一样的码农提出的String为何采用final的设计,阅读JD ...
- JDK源码学习系列05----LinkedList
JDK源码学习系列05----LinkedList 1.LinkedList简介 LinkedList是基于双向链表实 ...
- JDK源码学习系列04----ArrayList
JDK源码学习系列04----ArrayList 1. ...
- JDK源码学习系列03----StringBuffer+StringBuilder
JDK源码学习系列03----StringBuffer+StringBuilder 由于前面学习了StringBuffer和StringBuilder的父类A ...
- JDK源码学习系列02----AbstractStringBuilder
JDK源码学习系列02----AbstractStringBuilder 因为看StringBuffer 和 StringBuilder 的源码时发现两者都继承了AbstractStringBuil ...
- JDK源码学习系列01----String
JDK源码学习系列01----String 写在最前面: 这是我JDK源码学习系列的第一篇博文,我知道 ...
- JDK源码学习笔记——LinkedHashMap
HashMap有一个问题,就是迭代HashMap的顺序并不是HashMap放置的顺序,也就是无序. LinkedHashMap保证了元素迭代的顺序.该迭代顺序可以是插入顺序或者是访问顺序.通过维护一个 ...
- JDK源码学习笔记——String
1.学习jdk源码,从以下几个方面入手: 类定义(继承,实现接口等) 全局变量 方法 内部类 2.hashCode private int hash; public int hashCode() { ...
- JDK源码学习笔记——Integer
一.类定义 public final class Integer extends Number implements Comparable<Integer> 二.属性 private fi ...
随机推荐
- nlogn的最长不下降子序列【tyvj1254挑选士兵】
var a,d:Array[-..]of longint; i,n,m,k,l:longint; function erfen(x:longint):longint; var mid,h,t:long ...
- (转)springBoot 配置信息一览
原文链接:https://cloud.tencent.com/developer/article/1360699
- scrapy框架xpath的几点说明
1.xpath返回的是一个列表 2.调用Selector对象的extract方法将返回选中内容的Unicode字符串 SelectorList对象调用extract_first() 方法会返回其中第一 ...
- Mol Cell Proteomics. | MARMoSET – Extracting Publication-ready Mass Spectrometry Metadata from RAW Files
本文是马克思普朗克心肺研究所的三名研究者Marina Kiweler.Mario Looso和Johannes Graumann发表在8月刊的MCP的一篇文章. 由于Omics实验经常涉及数百个数据文 ...
- Web中间件 - 常见漏洞总结
*文章来源:https://blog.egsec.cn/archives/472 *本文将主要说明:Web中间件常见漏洞的产生原因以及修复方案 什么是Web中间件? 百度百科是这样解释的:中间件是介于 ...
- 欢乐C++ —— 2. 深复制与浅复制
1. 简述 通俗点讲,深复制与浅复制一般对指针而言, 深复制复制指针所指向的内容, 浅复制复制指针的值. 2. 举例 栗子: 当我们有现在有指针A指向一块数据,和指针B. 深复制- ...
- Linux常用命令 - cat命令详解
21篇测试必备的Linux常用命令,每天敲一篇,每次敲三遍,每月一循环,全都可记住!! https://www.cnblogs.com/poloyy/category/1672457.html 获取t ...
- vue - Babel之babel-polyfill、babel-runtime、transform-runtime
引言 babel默认只转换新的 JavaScript 语法,比如箭头函数.扩展运算(spread). 不转换新的 API,例如Iterator.Generator.Set.Maps.Proxy.Ref ...
- Numpy和OpenCV中的图像几何变换
介绍 上面的图像使它不言而喻什么是几何变换.它是一种应用广泛的图像处理技术.例如,在计算机图形学中有一个简单的用例,用于在较小或较大的屏幕上显示图形内容时简单地重新缩放图形内容. 它也可以应用于扭曲一 ...
- 知识图谱与机器学习 | KG入门 -- Part1-b 图深度学习
介绍 我们正在定义一种新的机器学习方法,专注于一种新的范式 -- Data Fabric. 在上一篇文章中,我们对机器学习给出了新的定义: 机器学习是一种自动发现Data Fabric中隐藏的&quo ...