Java集合学习笔记


- 如果两个对象通过equals()方法判断出是相等的,那么他们hashCode也应该相等;
- 如果两个对象通过equals()方法判断不等,那么他们hashCode可以相等,也可以不等。
如果没有实现以上两条(特别是第1条),在使用Java某些集合时(特别是HashSet和HashMap),你将得不到想要的结果,甚至造成严重的内存泄漏问题。要搞明白里面的原由,我们还得从HashMap的内部实现开始说起。
HashMap在存储键值对(Key-Value Pair)时,首先调用Key对象的hashCode()方法得到一个数字,这个数字对应了该键值对在HashMap中的存放位置,每个位置上不仅存放了Value,还存放了Key,即键值对(如下图所示)。我们将存放键值对的位置叫做一个Bucket(中文名为“桶”,即用来装东西的容器,很形象哈),Bucket中维护了一个LinkedList(下图中的Entries),该LinkedList用于存放实际的键值对本身。因此,要通过Key来获取到相应的Value,Java只需要再次调用Key的hashCode()方法得到该键值对在HashMap中的位置,便可以准确快速地获取到Key对应的Value。因此,即便用于存放的Key和用于获取的Key是相等的,如果他们的hashCode不等,那么在获取时便得不到先前存放的准确位置,进而得不到正确的结果。另外,如果Key对象的类没有实现equals()方法,那么默认情况下Java将使用对象的引用地址来判断两个对象的相等性, 而之后我们又很难再次创建出一个和先前引用地址相同的对象,因此便可能出现永远也获取不到Value的情况,从而导致内存泄漏。进而我们得到另一个结论:如果一个类的对象将被用于HashMap的Key或者被直接放入Set集合中,那么这个类应该实现equals()方法和hashCode()方法。

注意到上图中的152号Bucket了吗?我们发现同时有John Smith和Sandra Dee两个Key都指向了这个相同的Bucket,即这两个对象的hashCode相等。这便是equals()和hashCode()契约关系的第2点。Java采用了LinkedList来存放所有Key的hashCode相等的键值对。此时在LinkedList中,前一个键值对维护了一个指针指向了下一个键值对。当之后通过John Smith来获取Value时,Java首先发现其对应的Bucket中存在着两个键值对,然后Java分别将各个键值对中Key对象与所传来的Key对象相比,如果相等则返回该键值对所对应的Value。由此,我们也知道HashMap中为什么需要同时存Key和Value而不是只存Value的原因;同时也知道了契约第2点的来由。事实上,我们可以让一个类的所有对象都返回相同的hashCode,只是此时如果该类的对象作为Key时,所有的键值对都将存放都相同的Bucket位置,每次在获取的时候都需要做多次的比较,因此会影响HashMap的获取速度。
线程安全性
通常来说,在Java中可以通过两种方式来实现线程安全,一种是通过Java自带的并发管控手段(比如使用syncronized关键字),另一中是通过创建不可变(Immutable)对象。
在很早的时候,Java里面有Vector和HashTable两个集合对象,他们通过使用syncronized关键字实现了线程安全,但是同时也暴露出了很大的性能问题。因此现在基本上没有人使用了。为了解决Vector和HashTable的性能问题,Java从1.2引入的Collections框架采用了线程不安全的类,比如ArrayList和HashMap都是线程不安全的。当然,为了性能而牺牲了线程安全性也是不可取的,因此Java通过Fail-Fast的Iterator来避免多个线程同时操作集合所带的线程冲突问题。比如,当一个线程正在遍历一个集合而另一个线程正在修改该集合时,前者将抛出ConcurrentModificationException。这当然也不是万全的办法。
另一方面,Java其实也提供了线程安全的封装类(Wrapper)来实现集合的线程安全性,我们可以通过:
Collections.synchronizedXXX(collection)
来创建线程安全的集合,这里的XXX可以是Collection、List、Map和Set等。对于一个常规的colleciton对象,调用(synchronizedXXX)方法将得到封装后的线程安全性。
集合封装类同样采用了syncronized关键字来达到线程安全性,并且是在整个集合类上上锁,这样也会带来严重的性能问题。为了解决这样的问题,从Java 5开始引入了并发集合(Concurrent Collections),他们要么采用Immutable集合,要么采用更加精细的锁控制来达到线程安全的目的,同时又能保证很高的性能。
并发集合主要包含三类,一是Copy-On-Write集合,二是Compare-And-Swap集合,三是采用特殊锁的并发集合。Copy-On-Write集合底层维护的是一个不变的(Immutable)的数组,通过在写(Write)入集合时重新复制(Copy)一份新的集合来达到线程安全,进而得名Copy-On-Write。Coppy-On-Write集合包括有CopyOnWriteArrayList和CopyOnWriteArraySet等。Compare-And-Swap集合在进行更新的时候,首先维护一个本地拷贝,当执行更新时,比较本地拷贝与原值,如果值相等,则证明在这段时间内还没有其他线程修改原值,此时立即更新;如果不相等,则重新拷贝原值,再计算,再更新,这样也到了线程安全的目的。Compare-And-Swap集合包括ConcurrentLinkedQueue和ConcurrentSkipListMap等。第三类是使用特殊锁的集合,这种集合类并不在整个集合类上上锁,而是通过在Bucket级别上上锁,从而达到了对并发的更精细的控制,减少了线程的等待时间,从而提高了并发性能。
除了提供并发控制机制外,Java还提供了不可修改的(unmodifiable)集合来保证线程安全性,可以通过:
Collections.unmodifiableXXX(collection)
来创建不同unmodifiable集合。这样的集合其实也是一个封装类,对于传入的正常集合collection,通过对add()等方法抛出UnsupportedOperationException异常来达到不可修改的目的。但是,这样的集合其实并不达到不可修改目的,因为被其包装的collection本身依然是可以修改的。
为了实现更好的集合不变性,Guava类库提供了很多Immutable的集合,这些集合是真正不变的。
Java集合学习笔记的更多相关文章
- java 集合学习笔记
1.Collection(单列结合) List(有序,数据可重复) ArrayList:底层数据结构是数组,查询快,增删慢,线程不安全,效率高. Vector:底层数据结构是数组,查询快,增删慢,线程 ...
- [原创]java WEB学习笔记95:Hibernate 目录
本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...
- java JDK8 学习笔记——第16章 整合数据库
第十六章 整合数据库 16.1 JDBC入门 16.1.1 JDBC简介 1.JDBC是java联机数据库的标准规范.它定义了一组标准类与接口,标准API中的接口会有数据库厂商操作,称为JDBC驱动程 ...
- Android(java)学习笔记267:Android线程池形态
1. 线程池简介 多线程技术主要解决处理器单元内多个线程执行的问题,它可以显著减少处理器单元的闲置时间,增加处理器单元的吞吐能力. 假设一个服务器完成一项任务所需时间为:T1 创建线程时间, ...
- Android(java)学习笔记205:网易新闻RSS客户端应用编写逻辑过程
1.我们的项目需求是编写一个新闻RSS浏览器,RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是使用最广泛的XML应用.RSS目前广泛用于网上新闻频道,bl ...
- Java基础学习笔记总结
Java基础学习笔记一 Java介绍 Java基础学习笔记二 Java基础语法之变量.数据类型 Java基础学习笔记三 Java基础语法之流程控制语句.循环 Java基础学习笔记四 Java基础语法之 ...
- Android(java)学习笔记211:Android线程池形态
1. 线程池简介 多线程技术主要解决处理器单元内多个线程执行的问题,它可以显著减少处理器单元的闲置时间,增加处理器单元的吞吐能力. 假设一个服务器完成一项任务所需时间为:T1 创建线程时间, ...
- Java NIO学习笔记
Java NIO学习笔记 一 基本概念 IO 是主存和外部设备 ( 硬盘.终端和网络等 ) 拷贝数据的过程. IO 是操作系统的底层功能实现,底层通过 I/O 指令进行完成. 所有语言运行时系统提供执 ...
- Android(java)学习笔记148:网易新闻RSS客户端应用编写逻辑过程
1.我们的项目需求是编写一个新闻RSS浏览器,RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是使用最广泛的XML应用.RSS目前广泛用于网上新闻频道,bl ...
随机推荐
- 修改GitHub上项目语言显示的问题
问题 最近将自己写的博客放到github上了.由于使用了富文本编辑器.jQuery.Bootstrap等第三方插件,导致js.css等代码远远超过你自己写的代码. 于是也就成这样了 而且这里也显示Ja ...
- WPF 实现验证码功能
产生验证码的类:ValidCode.cs public class ValidCode { #region Private Fields /// <summary> /// PI /// ...
- CodeForces 327C
Magic Five Time Limit:1000MS Memory Limit:262144KB 64bit IO Format:%I64d & %I64u Submit ...
- AngularJs中ng-controller下的函数在调用时为什么会执行两次?
最近在学习AngularJs的过程中,自己做了个demo,但程序运行后却发现有个地方运行不对劲,纠结了半天,也问了,也查了,但是没有一个满意的答案,所以特地贴出来,请教各位大神(先说声谢谢了!).为了 ...
- HQL连接查询
HQL提供了连接查询机制如内连接,外连接,,还允许显示指定迫切内连接,和迫切外联结. 连接类型 内连接 inner join 或join 迫切内链接 inner join fetch 左外联结 le ...
- GIS制图课程目录(持续整理)
GIS制图课程目录 by 李远祥 由于过去一年都没有进行更新,近期终于抽出时间来进行相关知识的整理,因此,对专项技术进行了不同技术线条的梳理.为了方便阅读,特意整理一下全书的目录结构,希望对读者有帮助 ...
- 说说 bash 的 if 语句
说说 bash 的 if 语句 在开始先给大家列出几个术语,不做解释,不懂的可以参考其它资料. 术语和符号: 退出状态码 $? [...] (中括号,方括号) [[...]] (双中括号,双方括号) ...
- git 打卡的第一天
因为某种原因,所以不得不重新巩固下前端的基础知识,从最基本的学习还得额外的学习新知识,倍感压力之大. 昨天初略学习下git,算是自己学习的一个新知识.简单记录下,希望四海八荒的大神看过来,有错的请指导 ...
- java注解(基础)
一.认识注解 1.注解的定义: java提供了一种原程序中的元素关联任何信息和元数据的途径和方法. 2.学习注解的目的: (1)能够读懂别人写的代码,特别是框架相关的代码(框架中使用注解是非常方便的) ...
- ArcObjects与ArcEngine的联系与区别
ArcObjects与ArcEngine的联系与区别 AO一般指的是桌面产品开发组件,需要在桌面环境中才能够使用,最典型的就是嵌入式VBA开发.但是这样带来的弊端和OFFICE等相关软件一样明显,就是 ...