Java集合之Map和Set源码分析
以前就知道Set和Map是java中的两种集合,Set代表集合元素无序、不可重复的集合;Map是代表一种由多个key-value对组成的集合。然后两个集合分别有增删改查的方法。然后就迷迷糊糊地用着。突然在一个风雨交加的夜晚,感觉不能这样迷迷糊糊,得深入地去研究一下,于是去看了看源码(jdk1.8)。
1.Map源码。
/**
* An object that maps keys to values. A map cannot contain duplicate keys;
* each key can map to at most one value. *The Map interface provides three collection view, which
* allow a map's contents to be viewed as a set of keys, collection of values,
* or set of key-value mappings.
这是jdk源码中的对map这个接口的描述,大概意思是说这是一个键值对映射的对象,一个map中不能包含重复的键,每一个键最多映射一个值;map这个接口提供了三个集合视图,一个是关于key的set集合,一个是关于value的collection集合,还有一个是关于key-value映射关系的set集合。分别是以下几个集合对象。
Set<K> keySet();
Collection<V> values();
Set<Map.Entry<K, V>> entrySet();
可以很明显地看出,map就是set的扩展。看了这个有什么用呢?用途很多,更加深入理解集合,你会被这些设计者(Josh Bloch)的思想所折服—当然这都比较扯淡。来点实际的,以上三种集合的大小都是一样的,因为key-value是一一对应的,所以你有三种方式来遍历map。这位兄台已经进行实验。http://www.2cto.com/kf/201212/179013.html
public interface Map<K,V> {
// Query Operations
...
这是jdk1.8中的Map接口的定义,可以发现map并没有继承collection,但是我之前在网上看了好多都说map也继承的collection,让我百思不解。
2.Set源码。
public interface Set<E> extends Collection<E> {
// Query Operations
...
set才是真正地继承了collection接口,map只是在set的基础上的一个扩展。继承collection的还有List;
/**
* A collection that contains no duplicate elements. More formally, sets
* contain no pair of elements <code>e1</code> and <code>e2</code> such that
* <code>e1.equals(e2)</code>, and at most one null element. As implied by
* its name, this interface models the mathematical <i>set</i> abstraction.
以上是源码中对Set的描述 set是数学中的集合的概念,正如名字所暗示的一样,java中的Set是对数学中set的抽象,Set中的元素是不能重复的,Set最多可含一个null元素;对于任意的非null元素e1和e2,都满足e1.equals(e2)==false. 并且在Set接口中,还有一些交集和并集的方法,如 addAll(Collection<? extends E> c); containsAll(Collection<?> c);
(虽然集合号称存储的是Java对象,但实际上并不会真正将Java对象放在集合中,而是在集合中保留对象的引用)
3.HashMap和hashSet
(1)HashMap
HashMap是Map的一个具体实现。HashMap实际上是一个链表散列的数据结构,即数组和链表的结合体。HashMap的底层就是一个数组结构。
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
以上是是HashMap中的默认的构造方法,设置了DEFAULT_LOAD_FACTOR=0.75f, 还有带参数的构造方法,可以设置负载因子(一种时间和空间成本上的折衷),增大负载因子可以减少所占内存的开销,但是会增加查询数据的时间开销,get()和put()都会用到查询。其他的构造方法中还有一个参数initialCapacity,定义了一个默认的数值DEFAULT_INITIAL_CAPACITY = 1 << 4;结果就是16,一个hashMap初始的容量就是16,但是会动态地改变大小,这里的initialCapacity不等于size()返回的值。
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
以上是hashMap中的对于put方法的描述,如果元素重复,则会保留key,替换value;刚刚在介绍Map时提到了Map.Entry这个东西,在hashMap中,Node<K,V>实现了这个接口(static class Node<K,V> implements Map.Entry<K,V> ); 每个key-value都放在了Node<K,V>这个对象中,采用 Node<K,V>[] tab 数组的方式来保存key-value对;HashMap使用一种传说中的“Hash算法”来确定每个元素的存储位置, 调用key的hashCode()方法,通过返回值来确定每个元素的存储位置。如果在数组的该位置上已经存放了其他元素,那么这里的位置将以链表的形式存放。同理,get方法也是如此。
(2)HashSet以下是HashSet源码中的构造方法:
/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}
一看到默认的构造方法就什么都明白了,HashSet是基于HashMap实现的,只是封装了HashMap,源码中也是这样描述的;在HashSet中也说明了initial capacity (16) and load factor (0.75). 初始的容量是16,默认的负载因子是0.75。
(3)treeMap
TreeMap中的元素也是存储在一个Entry<K,V>中,但是底层是用一棵“红黑树”来保存Entry,因此,TreeMap添加元素、取出元素的性能比HashMap低。当需要添加元素时,要遍历这棵二叉树才能插入合适的位置,而HashMap是根据hashCode返回值来确定Entry的存放位置,所以TreeMap存取元素比较消耗性能。但正因为如此,TreeMap也有自己的优势,TreeMap中的元素总是保持一种有序的状态。
public static void main(String[] args) {
Map map = new TreeMap();
map.put("9", 9);
map.put("2", 2);
map.put("1", 1);
map.put("4", 4);
Iterator it = map.keySet().iterator();
while (it.hasNext()) {
System.out.println(map.get(it.next()));
}
}
//结果是:
1
2
4
9
(4)TreeSet
以下是TreeSet源码中的构造方法,类似于HashSet,封装了一个TreeMap,在TreeSet中元素也是有序的。
public TreeSet() {
this(new TreeMap<E,Object>());
}
Java集合之Map和Set源码分析的更多相关文章
- Java集合详解及List源码分析
对于数组我们应该很熟悉,一个数组在内存中总是一块连续的存储空间,数组的创建使用new关键字,数组是引用类型的数据,一旦第一个元素的位置确定,那么后面的元素位置也就确定了,数组有一个最大的局限就是数组一 ...
- java集合【13】——— Stack源码分析走一波
前言 集合源码分析系列:Java集合源码分析 前面已经把Vector,ArrayList,LinkedList分析完了,本来是想开始Map这一块,但是看了下面这个接口设计框架图:整个接口框架关系如下( ...
- Java集合框架之接口Collection源码分析
本文我们主要学习Java集合框架的根接口Collection,通过本文我们可以进一步了解Collection的属性及提供的方法.在介绍Collection接口之前我们不得不先学习一下Iterable, ...
- 6.Java集合-LinkedList实现原理及源码分析
Java中LinkedList的部分源码(本文针对1.7的源码) LinkedList的基本结构 jdk1.7之后,node节点取代了 entry ,带来的变化是,将1.6中的环形结构优化为了直线型链 ...
- 3.Java集合-HashSet实现原理及源码分析
一.HashSet概述: HashSet实现Set接口,由哈希表(实际上是一个HashMap实例)支持,它不保证set的迭代顺序很久不变.此类允许使用null元素 二.HashSet的实现: 对于Ha ...
- 1.Java集合-HashMap实现原理及源码分析
哈希表(Hash Table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表,而HashMap的实现原理也常常 ...
- 集合下篇—Map和Set 源码分析
Map Map不同于Collection集合,Map存放的是键值对,且键不能重复 1 .HashMap (底层是哈希表,Java中用链表的数组实现,存取顺序不一致) 这篇博客主要讲集合的,哈希表这样的 ...
- Java集合【5】-- Collections源码分析
目录 一.Collections接口是做什么的? 二.Collections源码之大类方法 1.提供不可变集合 2.提供同步的集合 3.类型检查 4.提供空集合或者迭代器 5.提供singleton的 ...
- Java集合【8】-- ArrayList源码分析
目录 1. ArrayList 1.1 ArrayList特点介绍 1.2 实现的接口和继承的类 2. 成员变量 3. 构造方法 4. 常用增删改查方法 添加元素 查询元素 更新元素 删除元素 5.自 ...
随机推荐
- SVN就是这么简单
什么是SVN SVN全称:Subversion,是一个开放源代码的版本控制系统 Svn是一种集中式文件版本管理系统.集中式代码管理的核心是服务器,所有开发者在开始新一天的工作之前必须从服务器获取代码, ...
- 从设计模式的角度看Java程序优化
一.前言 Java程序优化有很多种渠道,比如jvm优化.数据库优化等等,但都是亡羊补牢的措施,如果能在设计程序架构时利用设计模式就把程序的短板解决,就能使程序更加健壮切容易维护迭代 二.常用的设计模式 ...
- 痞子衡嵌入式:ARM Cortex-M内核那些事(3)- 功能模块
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是ARM Cortex-M功能模块. ARM Cortex-M处理器家族发展至今(2016),已有5代产品,分别是CM0/CM0+.CM1 ...
- 第13章 切换到混合流并添加API访问 - Identity Server 4 中文文档(v1.0.0)
在之前的快速入门中,我们探讨了API访问和用户身份验证.现在我们想把这两个部分放在一起. OpenID Connect和OAuth 2.0组合的优点在于,您可以使用单个协议和使用令牌服务进行单次交换来 ...
- Linux,在不使用U盘的情况下使用wubi.exe程序在Win7上安装ubuntu-14.04.3版系统
本文介绍如何在不使用U盘的情况下使用wubi.exe程序在Win7上安装ubuntu-14.04.3版系统. 花了一天的时间终于安装上了Ubuntu14.04,过程坎坷,是血泪史,开始报“cannot ...
- 使用nssm部署windows服务启动应用
swoole和workerman他们都可以实现即时通信的功能,这里我简单的就workman作为windows服务器启动为例说哈吧.直接进入正题: 下载这个聊天室项目 workerman聊天室 http ...
- 记Android开发中的一些另类使用
1.使用recyclerview,直接添加下列依赖就可以使用recyclerview,版本号与appcompat-v7版本号相同 compile 'com.android.support:design ...
- 史上最全python面试题详解(四)(附带详细答案(关注、持续更新))
python高级进阶-网络编程和并发(?道题详解) 1.简述 OSI 七层协议. OSI是Open System Interconnection的缩写,意为开放式系统互联. OSI七层协议模型主要是: ...
- Hacking /dev/random: Pipe
1) 下载镜像,虚拟机启动 https://download.vulnhub.com/devrandom/pipe.ova 2) nmap 扫描探测 Nmap 扫描开路: ╰─ nmap -Pn -s ...
- Net中获取程序集路径
从内存中加载的程序集,无路径 IIS中路径 protected void Page_Load(object sender, EventArgs e) { Response.Write(&quo ...