在java面试中集合类似乎已经是绕不开的话题,对于一个中高级java程序员来说如果对集合类的内部原理不了解,基本上面试都会被pass掉。下面从面试官的角度来聊聊一个候选者应该对HashMap了解到什么程度才算是合格。

问题一:在日常开发中使用过的java集合类有哪些?

一般应聘者都会回答ArrayList,LinkedList,HashMap,HashSet等等。如果连这几个集合类都不知道,基本上可以pass了。

问题二:能描述一下HashMap的实现原理吗?

其实HashMap是典型的空间换时间的一种技术手段。如果面试者在这个问题中不能很好的阐述HashMap的实现原理,比如不知道如何解决hash冲突,不知道loadFactor这样的核心概念以及扩容机制。基本上我不会做深入考察了,可以pass了。

问题三:平时在使用HashMap时一般使用什么类型的元素作为Key?

面试者通常会回答,使用String或者Integer这样的类。这个时候可以继续追问为什么使用String、Integer呢?这些类有什么特点?如果面试者有很好的思考,可以回答出这些类是Immutable的,并且这些类已经很规范的覆写了hashCode()以及equals()方法。作为不可变类天生是线程安全的,而且可以很好的优化比如可以缓存hash值,避免重复计算等等,那么基本上这道题算是过关了。

问题四:如果让你实现一个自定义的class作为HashMap的key该如何实现?

这个问题其实隐藏着几个知识点,覆写hashCode以及equals方法应该遵循的原则,在jdk文档以及《effective java》中都有明确的描述。当然这也在考察应聘者是如何自实现一个Immutable类。如果面试者这个问题也能回答的很好,基本上可以获得一点面试官的好感了。

问题四延伸:你能设计一个算法(输入是java源文件),判断一个类是否是Immutable的吗?

这道题考察面非常非常广。如果这个问题面试者回答上了,我觉得面试者的基础知识无需考察了。可以继续考察高并发与分布式架构设计了。

问题五:如何衡量一个hash算法的好坏,你知道的常用hash算法有哪些?

如果面试者的技术面比较宽,或者算法基础以及数论基础比较好,这个问题才可以做很好的回答。首先,hashCode()不要求唯一但是要尽可能的均匀分布,而且算法效率要尽可能的快。如果面试者能回答出一些常用的算法,比如MurMurHash(萌萌哒的名字)基本上已经可以俘获面试官了。如果面试者有编译器的背景说出了如何在编译领域使用完美哈希的场景,那就太棒了,毕竟编译原理学的好的人太少了。当然不要忘记了,还可以再考察一下java中String类的hashCode()的实现:

public int hashCode() {
    int h = hash;
    if (h == 0 && count > 0) {
       int off = offset;
**java交流群669823128** char val[] = value; int len = count; for (int i = 0; i < len; i++) { h = 31*h + val[off++]; } hash = h; } return h; }

为什么 h = 31 * h + val[off++]; 这一行使用31 ,而不是别的数字,这是一个魔术吗?

如果都结束了,不要忘了再问一句你知道hash攻击吗?有避免手段吗?就看面试者对各个jdk版本对HashMap的优化是否了解了。这就引出了另一个数据结构红黑树了。可以根据岗位需要继续考察rb-tree,b-tree,lsm-tree等常用数据结构以及典型应用场景。

问题六: HashMap是线程安全的吗? 如果多个线程操作同一个HashMap对象会产生哪些非正常现象?

其实这已经开始考察面试者对并发知识的掌握情况了。HashMap在resize时候如果多个线程并发操作如何导致死锁的。面试者不一定知道,但是可以让面试者分析。毕竟很多类库在并发场景中不恰当使用HashMap导致过生产问题。

问题七: ConcurrentHashMap vs HashTable 他们是如何处理并发的?为什么有了ConcurrentHashMap 没有把 HashTable 用@Deprecated注解废弃掉?

这个时候问题已经升级了,希望面试者分析过这两个类的源代码。我们是希望面试者能够知道ConcurrentHashMap 的内部实现原理,而且几乎是个硬性要求了。后一个问题似乎更难一些,主要是进一步考察面试者对细节的一些思考。

问题八:假如在一个没有GC的语言(比如c语言)中实现一个HashMap,如何处理表扩容以及收缩问题?

现在很多内存数据库,比如redis内部使用的还是HashMap这种数据结构,但是在数据量特别大的时候比如100W的记录数,在遇到扩容的时候如果暴力的扩容2倍,然后做rehash,肯定是有问题的。那么如何避免呢?当缓存的数据不断的被删除或者到期失效,如何有效的管理内存空间呢?这些都是值得面试者思考的问题。

其他问题

可以追问一些技术实现细节,比如为什么HashMap中bucket的大小为什么是2的幂之类的实现细节。

HashMap涉及的知识点特别多,文中的一些问题做了简要的回答以及提示。我并不会给出所谓的标准答案,其实在面试的过程中面试官并不要求面试者对所有问题都给出答案,重要的还是要考察面试者对问题的思考过程。有些问题,比如问题一、问题二、属于元知识的考察,不知道是不可原谅的,但是后面的一些问题比如问题四扩展,就很开放。是我在思考如何让编译器做更多的编译检查,以及如何对源代码做更多的静态分析考虑的问题。

java交流群669823128

HashMap面试题:90%的人回答不上来的更多相关文章

  1. Win7共享文件夹简单?这个共享问题可以难倒90%的人

    信息化社会,没有哪个公司不用电脑办公了.一个办公室里面的同事相互之间利用系统的共享功能,共享一些文件和软件已经是司空见惯的了,这个不需要多么复杂的操作.我们使用最多的windows7操作系统就能很方便 ...

  2. Python IAQ中文版 - Python中少有人回答的问题

    Python中少有人回答的问题 The Python IAQ: Infrequently Answered Questions 1 Q: 什么是"少有人回答的问题(Infrequently ...

  3. 阿里面试官:字符串在JVM中如何存放?90%的人就真的只回答在哪里存放

    目录: 一道面试题的引出 案例分析 intern 源码分析 总结 1. 一道面试题的引出 在面试BAT这种一线大厂时,如果面试官问道:字符串在 JVM 中如何存放?大多数人能顺利的给出如下答案: 字符 ...

  4. 类和对象在JVM中是如何存储的,竟然有一半人回答不上来!

    前言 这篇博客主要来说说类与对象在JVM中是如何存储的,由于JVM是个非常庞大的课题,所以我会把他分成很多章节来细细阐述,具体的数量还没有决定,当然这不重要,重点在于是否可以在文章中学到东西,是否对J ...

  5. 一道简单的HashMap面试题所想到的...

    前言 看到一个JDK1.7和JDK1.8中关于HashMap的一个面试题: JDK1.7和1.8中HashMap中链表的插入的方式有什么不同? 原以为自己对HashMap的源码理解的还算可以了,应该足 ...

  6. HashMap面试题,看这一篇就够了!

    目录 序言 一.JDK7中的HashMap底层实现 1.1 基础知识 1.2 put()方法 1.2.1 特殊key值处理 1.2.2 扩容 1.2.3 如何计算bucket下标? 1.2.4 在目标 ...

  7. HashMap面试题解答

    一.HashMap的实现原理? 此题可以组成如下连环炮来问 你看过HashMap源码嘛,知道原理嘛?为什么用数组+链表?hash冲突你还知道哪些解决办法?我用LinkedList代替数组结构可以么?既 ...

  8. 阿里面试官最喜欢问的21个HashMap面试题

    1.HashMap 的数据结构? A:哈希表结构(链表散列:数组+链表)实现,结合数组和链表的优点.当链表长度超过 8 时,链表转换为红黑树. transient Node<K,V>\[\ ...

  9. HashMap面试题

    HashMap原理: “HashMap基于hashing原理,我们通过put()和get()方法储存和获取对象.当我们将键值对传递给put()方法时,它调用键对象的hashCode()方法来计算has ...

随机推荐

  1. 洗礼灵魂,修炼python(6)--活起来的代码+列表

    活起来的用法: 使用input内置函数 注意python2中和python3中,input函数是不太一样的,python2中,input用户传入什么类型就是什么类型而python3中,不管传入什么类型 ...

  2. asp.net web api 2.2 基础框架(带例子)

    链接:https://github.com/solenovex/asp.net-web-api-2.2-starter-template 简介 这个是我自己编写的asp.net web api 2.2 ...

  3. Cow Uncle 学习了叉积的一点运用,叉积真的不错

    Cow Uncle Time Limit: 4000/2000MS (Java/Others) Memory Limit: 128000/64000KB (Java/Others) SubmitSta ...

  4. Longge's problem poj2480 欧拉函数,gcd

    Longge's problem Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 6918   Accepted: 2234 ...

  5. http://codeforces.com/problemset/problem/712/D

    D. Memory and Scores time limit per test 2 seconds memory limit per test 512 megabytes input standar ...

  6. jQuery中的常用内容总结(三)

    jQuery中的常用内容总结(三) 转载请注明地址:http://www.cnblogs.com/funnyzpc/p/7571998.html 内容提要 选择器(第一节) 选择器的扩展方法(第一节) ...

  7. Tensorflow卷积神经网络

    卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络, 在计算机视觉等领域被广泛应用. 本文将简单介绍其原理并分析Tensorflow官方提供的示例. ...

  8. 【转】Python正则表达式指南

    1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...

  9. http://zthdd.bokee.com/6189963.html

    http://zthdd.bokee.com/6189963.html先保存

  10. 数据迁移过程中hive sql调优

    本文记录的是,在数据处理过程中,遇到了一个sql执行很慢,对一些大型的hive表还会出现OOM,一步一步通过参数的设置和sql优化,将其调优的过程. 先上sql ) t where t.num =1) ...