HashMap的存储结构及原理

1、HashMap的数据结构(HashMap通过hashcode对其内容进行高速查找，是无序的)

数据结构中有数组和链表来实现对数据的存储，但这两者基本上是两个极端。

数组：数组的存储区是连续的，占用内存严重，故空间复杂度非常大。但数组的二分查找时间度小；数组的特点：寻址easy，插入和

删除困难。

链表：链表的储存区离散。占用内存比較宽松。故空间复杂度非常小，但时间复杂度大；链表的特点：寻址困难，插入和删除easy。

哈希表

HashMap是由数组+链表组成。寻址easy，插入和删除easy。（存储单元数组Entry[]，数组里面包括链表）

HashMap事实上也是由一个线性的数组实现的。

所以能够理解为其存储数据的容器就是一个线性容器；

HashMap里面有一个内部静态类Entry，其重要的属性有key，value，next，从属性key，value 就能够非常明显的看出来 Entry就是

HashMap键值对实现的一个基础bean；也就是说HashMap的基础就是一个线性数组，这个数组就是Entry[]。Map里面的内容都保存

在Entry[]中；

    /**

     * The table, resized as necessary. Length MUST Always be a power of two.

     */

    transient Entry[] table;

2、HashMap的存取实现

2.1：存储

这里HashMap用了一个算法。

//存储时候：

int hash=key.hashCode(); //获取key的hashCode，这个值是一个固定的int值

int index=hash%Entry[].length。//获取数组下标：key的hash值对Entry数组长度进行取余

Entry[index]=value。

注意：假设两个key通过hash%Entry[].length得到的index同样。会不会覆盖？

是不会的。Entry类有一个next属性，作用是指向下一个Entry。打个例如，第一个键值对A进来。通过计算其key的hash得到的

index=0。记做:Entry[0] = A。一会后又进来一个键值对B，通过计算其index也等于0，如今怎么办？HashMap会这样做:B.next =

A,Entry[0] = B,假设又进来C,index也等于0,那么C.next = B,Entry[0] = C；这样我们发现index=0的地方事实上存取了A,B,C三个键值对,他

们通过next这个属性链接在一起。

所以疑问不用操心。

也就是说Entry[]数组中存储的是最后插入的数据

	 public V put(K key, V value) {

	        if (key == null)

	            return putForNullKey(value); //null总是放在数组的第一个链表中

	        int hash = hash(key.hashCode());

	        int i = indexFor(hash, table.length);

	        //遍历链表

	        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

	            Object k;

	            //假设key在链表中已存在，则替换为新value

	            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

	                V oldValue = e.value;

	                e.value = value;

	                e.recordAccess(this);

	                return oldValue;

	            }

	        }

	        modCount++;

	        addEntry(hash, key, value, i);

	        return null;

	    }

	void addEntry(int hash, K key, V value, int bucketIndex) {

	    Entry<K,V> e = table[bucketIndex];

	    table[bucketIndex] = new Entry<K,V>(hash, key, value, e); //參数e, 是Entry.next

	    //假设size超过threshold，则扩充table大小。再散列

	    if (size++ >= threshold)

	            resize(2 * table.length);

	}

2.2：取值

获取key的hashcode指，通过hash值去hash%Entry[].length 获取Entry[hash%Entry[].length]，定位到该数组元素之后，再遍历该元

素处的链表。

//取值时候：

int hash=key.hashCode();

int index =hash%Entry[].length;

return Entry[index];

     public V get(Object key) {

	        if (key == null)

	            return getForNullKey();

	        int hash = hash(key.hashCode());

	        //先定位到数组元素。再遍历该元素处的链表

	        for (Entry<K,V> e = table[indexFor(hash, table.length)];

	             e != null;

	             e = e.next) {

	            Object k;

	            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))

	                return e.value;

	        }

	        return null;

	}

当哈希表的容量超过默认容量时，必需要调整table的大小。

当容量达到最大值时，该方法Integer.MAX_VALUE返回。这时。就需要创建

一张表，将原来的表映射到新表中。

3、HashMap、HashTable和ConcurrentHashMap的线程安全问题

HashMap：线程不安全的。

HashTable：锁住整张hash表，让线程独占。hashMap同意为空。

通过分析Hashtable就知道，synchronized是针对整张Hash表的，即每次锁住整张表

让线程独占。安全的背后是巨大的浪费。

ConcurrentHashMap:一个更快的hashmap，它提供了好得多的并发性。多个读操作差点儿总能够并发地运行。

他是锁段（默认：把hash表分为16个

段），在get，put，remove等操作中，ConcurrentHashMap仅仅锁定当前须要用到的段，仅仅有在求size的时候才锁定整张hash表。

HashMap的存储结构及原理的更多相关文章

牛客网Java刷题知识点之HashMap的实现原理、HashMap的存储结构、HashMap在JDK1.6、JDK1.7、JDK1.8之间的差异以及带来的性能影响
不多说,直接上干货! 福利 => 每天都推送欢迎大家,关注微信扫码并加入我的4个微信公众号: 大数据躺过的坑 Java从入门到架构师人工智能躺过的坑 ...
扰动函数和拉链法模拟HashMap的存储结构
HashMap是Map接口下面的子孙,它对外是K,V结构存储的,而内部也着自己的存储结构,它的get操作是O(1)的时间复杂度,可以说是非常快的找到目录,而添加时,也是O(1),所以在键值存储里,它成 ...
hbase操作（shell 命令，如建表，清空表，增删改查）以及 hbase表存储结构和原理
两篇讲的不错文章 http://www.cnblogs.com/nexiyi/p/hbase_shell.html http://blog.csdn.net/u010967382/article/de ...
HashMap的底层结构和原理
http://youzhixueyuan.com/the-underlying-structure-and-principle-of-hashmap.html HashMap是Java程序员使用频率最 ...
hbase 存储结构和原理
HBase的表结构建表时要指定的是:表名.列族建表语句 create 'user_info', 'base_info', 'ext_info' 意思是新建一个表,名称是user_info,包含两个 ...
Map实现之HashMap（结构及原理）(转)
java.util包中的集合类包含 Java 中某些最常用的类.最常用的集合类是 List 和 Map.List 的具体实现包括 ArrayList 和 Vector,它们是可变大小的列表,比较适合构 ...
HashMap的存储原理
HashMap是java中相当重要的数据结构,使用HashMap的场景非常之多,因此,了解HashMap实现的过程和原理,是非常有必要的,在一些面试中也会经常被问到.好了,我们赶紧来研究java内部是 ...
HashMap底层结构、原理、扩容机制
https://www.jianshu.com/p/c1b616ff1130 http://youzhixueyuan.com/the-underlying-structure-and-princip ...
Atitit.数据索引的种类以及原理实现机制索引常用的存储结构
Atitit.数据索引的种类以及原理实现机制索引常用的存储结构 1. 索引的分类1 1.1. 按照存储结构划分btree,hash,bitmap,fulltext1 1.2. 索引的类型按查找 ...

随机推荐

TypedArray和obtainStyledAttributes使用
在编写Android自定义按钮示例基础上,如果要指定字体大小产生这样的效果: 其实是不需要自定义变量的,可以直接使用TextView的配置属性: <com.easymorse.textbutto ...
MODULE_DEVICE_TABLE
1. MODULE_DEVICE_TABLE (usb, skel_table);该宏生成一个名为__mod_pci_device_table的局部变量,该变量指向第二个参数.内核构建时,depmod ...
浅析 MySQL Replication（本文转自网络，非本人所写）
作者:卢飞来源:DoDBA(mysqlcode) 0.导读本文几乎涵盖了MySQL Replication(主从复制)的大部分知识点,包括Replication原理.binlog format.复 ...
【VS2015正式版下载】Visual Studio 2015 正式版开放下载 Visual Studio 2015 神key
说明: 微软定于2015年7月20日发布Visual Studio 2015正式版,目前其官方网站已经提供正式版本的下载. 可在https://www.visualstudio.com/en-us/d ...
JQuery中常用的属性选择器
jQuery中使用$()作为选择符极大提高工作效率以及方便快捷;一些常用属性的选择器由以下几种 1) $('#id') id选择器 2) $('.class') css选择器,class类名 3) $ ...
浅述Oracle分布式事务概念
着系统的复杂性不断增加,我们所面对的分布式系统渐渐增加.分布式文件系统.分布式消息队列系统等等层出不穷,在一些行业特别是互联网行业应用广泛.分布式数据库也是目前使用比较常用的分布式系统之一. 简单来说 ...
网页调用QQ聊天
把下面的复制到地址栏里,QQ号为你要聊天的人的qq号,如果你没有登录你自己的qq,首先会调出qq登录窗体. tencent://message/?uin=QQ号
SICP 阅读笔记(二)
Chapter 1: Building Abstractions with Procedures 2015-09-29 016 Preface of this chapter QUOTE: The a ...
[c#]asp.net开发微信公众平台(7)前6篇的整体框架demo源码
这里给出的demo是具备整体框架的微信公众平台源码, 所谓demo就是拿过去就可以直接演示使用的东西, 当然不会具备非常详细的具体到业务层面.数据层面的东西, 每个人都可以在此基础上自由发挥, 只 ...
Zookeeper+Kafka+Storm+HDFS实践
Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. Hadoop一般用在离线的分析计算中,而storm区别于hadoop,用在实时的流式计算中,被广泛用来 ...

HashMap的存储结构及原理

HashMap的存储结构及原理的更多相关文章

随机推荐

热门专题