【Java必修课】String.intern()原来还能这么用(原理与应用)
1 简介
String.intern()是JDK一早就提供的native方法,不由Java实现,而是底层JVM实现,这让我们对它的窥探提高了难度。特别是在Oracle收购了Sun公司后,源代码不开源了,更无法深入研究了。但我们还是有必要尽量地去探索。
本文将主要讲解一下String.intern()方法的原理、特点,并介绍一个新奇的应用。
2 String的池化
方法intern()的作用就是将String池化,这个池是String的常量池。不同版本的JDK有不同的实现。
2.1 不同实现与不同内存空间
- JDK 6:
intern()方法会把首先遇到的字符串复制一份到永久代中,然后返回永久中的实例引用;如果不是首次,说明常量池中已经有该字符串,直接返回池中的引用。常量池在永久代(PermGen)中。 - JDK 7:
intern()方法首次遇到字符串时,不会复制实例,而是直接把该字符串的引用记录在常量池中,并返回该引用;如果不是首次,则直接返回池中引用。JDK 7常量池在堆中。 - JDK 8:功能与JDK 7类似。常量池在元空间Metaspace中,元空间不在虚拟机内存中,而是使用本地内存。
2.2 常量池大小差异
这个所谓的String常量池,其实就是一张哈希表,跟HashMap类似,所以也是有大小限制和哈希冲突可能。常量池越大,哈希冲突可能性越小。
JDK 6早期版本,池大小为常量1009,后期变得可配置,通过参数
-XX:StringTableSize=N指定。大小也会受限于永久代的大小,建议避免使用intern()方法,防止造成PermGen内存溢出。JDK 7将常量池移到堆后,可以存放更多常量,也一样通过参数可配置大小。在Java 7u40后,常量池默认大小增加到了60013。
JDK 8默认大小一开始就是60013,依旧支持参数配置。
总的来说,-XX:StringTableSize的默认值在Java 7u40以前为1009,Java 7u40以后改为60013。
3 例子分析
通过例子,来理解一下就更清晰了。JDK 7和8应该表现一致,本文使用JDK 8。
3.1 JDK 8
先演示JDK 8的情况:
例子1
String str1 = new String("pkslow");
System.out.println(str1.intern() == str1);
结果:false
分析:因为使用了字面量,在编译期就会把字符串放到常量池,当使用new String()时,会创建新的对象。所以常量池中的引用与创建的对象引用不同。
例子2
String str1 ="pkslow";
System.out.println(str1.intern() == str1);
结果:true
分析:与上个例子对比,将常量池的地址赋值给了str1变量,所以相等。
例子3
String str1 = new StringBuilder("pk").append("slow").toString();
System.out.println(str1.intern() == str1);
String str2 = new StringBuilder("pk").append("slow").toString();
System.out.println(str2.intern() == str2);
结果:true false
分析:
(1)第一句创建了一个新的字符串对象,str1为其引用,调用str1.intern()时会把它的引用放到常量池中并返回,所以是同一个引用。
(2)在(1)中已经放在常量池了,所以str2.intern()返回的是str1,与str2不相等。
例子4
String str = new StringBuilder("ja").append("va").toString();
System.out.println(str.intern() == str);
结果:false
分析:按理说与上个例子的(1)一样,应该为true才对。问题在于java它是一个比较特殊的字符串,已经在常量池中存在了,所以不相等。至于为何会存在,我的猜想是有两种可能:其它JDK的Java代码有该常量;JVM代码直接把某些特殊字符串放到了常量池。这个没有深究了。
3.2 JDK 6的不同
当我们知道了原理后,不同表现就可以很容易判断出来了。如下例子:
String str1 = new StringBuilder("pk").append("slow").toString();
System.out.println(str1.intern() == str1);
JDK 6结果:false
JDK 8结果:true
因为JDK 6对于首次遇到的字符串,会复制一份到常量池并返回其引用,与str1的引用不是同一个,所以为false。而JDK 8只是将str1的引用在常量池记录然后返回,还是同一个,所以为true。
知道了基本原理,更多情况就可以具体分析了,不再一一赘述。
4 一种少见的应用
之前已经说过,String.intern()方法本质就是维持了一个String的常量池,而且池里的String应该都是唯一的。这样,我们便可以利用这种唯一性,来做一些文章了。我们可以利用池里String的对象来做锁,实现对资源的控制。比如一个城市的某种资源同一时间只能一个线程访问,那就可以把城市名的String对象作为锁,放到常量池中去,同一时间只能一个线程获得。
具体代码如下:
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
public class StringInternMultiThread {
private String city;
public StringInternMultiThread(String city) {
this.city = city;
}
public void handle() {
synchronized (this.city.intern()) {
System.out.println(city + ":Fetched the lock");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(city + ":Release the lock");
}
}
public static void main(String[] args) {
ExecutorService executorService = Executors.newFixedThreadPool(6);
StringInternMultiThread guangzhou = new StringInternMultiThread("Guangzhou");
StringInternMultiThread shenzhen = new StringInternMultiThread("Shenzhen");
StringInternMultiThread beijing = new StringInternMultiThread("Beijing");
executorService.execute(guangzhou::handle);
executorService.execute(guangzhou::handle);
executorService.execute(guangzhou::handle);
executorService.execute(shenzhen::handle);
executorService.execute(shenzhen::handle);
executorService.execute(beijing::handle);
executorService.shutdown();
}
}
运行结果如下:
Guangzhou:Fetched the lock
Shenzhen:Fetched the lock
Beijing:Fetched the lock
Beijing:Release the lock
Shenzhen:Release the lock
Guangzhou:Release the lock
Shenzhen:Fetched the lock
Guangzhou:Fetched the lock
Shenzhen:Release the lock
Guangzhou:Release the lock
Guangzhou:Fetched the lock
Guangzhou:Release the lock
可以看出,同一时间同一个城市不会同时获得资源,而不同城市可以同时获得资源来处理。这种案例其实有其它更优雅的方案,这不是本文的重点,就不赘述了。
5 总结
本文介绍了String.intern()方法的原理和不同JDK版本的表现,并通过多个例子与一个应用加深理解。希望对大家理解String和JVM有帮助。
欢迎关注公众号<南瓜慢说>,将持续为你更新...

多读书,多分享;多写作,多整理。
【Java必修课】String.intern()原来还能这么用(原理与应用)的更多相关文章
- java 字符串String.intern()方法学习
在jdk1.6与jdk1.7中,String类中的intern()方法实现的原理是有一些差异的.1.在jdk1.6中,intern()方法是先查找字符串常量池是否含有当前字符串,如果没有,那么就在字符 ...
- 深入理解Java String#intern() 内存模型
原文出处: codelog.me 大家知道,Java中string.intern()方法调用会先去字符串常量池中查找相应的字符串,如果字符串不存在,就会在字符串常量池中创建该字符串然后再返回. 字符串 ...
- Java中String的intern方法,javap&cfr.jar反编译,javap反编译后二进制指令代码详解,Java8常量池的位置
一个例子 public class TestString{ public static void main(String[] args){ String a = "a"; Stri ...
- String学习之-深入解析String#intern
引言 在 JAVA 语言中有8中基本类型和一种比较特殊的类型String.这些类型为了使他们在运行过程中速度更快,更节省内存,都提供了一种常量池的概念.常量池就类似一个JAVA系统级别提供的缓存. 8 ...
- 深入解析String#intern
转自:https://tech.meituan.com/in_depth_understanding_string_intern.html 深入解析String#intern john_yang ·2 ...
- (转载)深入解析String#intern
本文转载自:深入解析String#intern 引言 在 JAVA 语言中有8中基本类型和一种比较特殊的类型String.这些类型为了使他们在运行过程中速度更快,更节省内存,都提供了一种常量池的概念. ...
- 聊聊Java String.intern 背后你不知道的知识
Java的 String类有个有意思的public方法: public String intern() 返回标准表示的字符串对象.String类维护私有字符串池. 调用此方法时,如果字符串池已经包含等 ...
- Java提高篇——理解String 及 String.intern() 在实际中的应用
1. 首先String不属于8种基本数据类型,String是一个对象. 因为对象的默认值是null,所以String的默认值也是null:但它又是一种特殊的对象,有其它对象没有的一些特性. 2. ...
- java 创建string对象机制 字符串缓冲池 字符串拼接机制 字符串中intern()方法
字符串常量池:字符串常量池在方法区中 为了优化空间,为了减少在JVM中创建的字符串的数量,字符串类维护了一个字符串池,每当代码创建字符串常量时,JVM会首先检查字符串常量池.如果字符串已经存在池中,就 ...
随机推荐
- [Python] Python 学习记录(1)
1.概论 弱类型 一个变量能被赋值时能与原类型不同 x = 1 x = "1" #不加分号,给x赋值为int后再次赋值为string是可行的 与或非 and or not / ...
- 详述Python序列化
一.前言 1. 现实需求 每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Python也是一样.很多时候我们会有这样的需求: 把内存中的各种数据类型的 ...
- MQTT介绍与使用
物联网是新一代信息技术的重要组成部分,也是“信息化”时代的重要发展阶段.其英文名称是:“Internet of things(IoT)”.顾名思义,物联网就是物物相连的互联网.这有两层意思:其一,物联 ...
- Math中ceil中为什么会有负零
double c=Math.ceil(-0.5); double d=Math.floor(0.5); System.out.println(c); System.out.println(d); Sy ...
- 利用电脑开启自带虚拟wifi,无需第三方工具。
注:此方法只验证win 7以上系统,XP server 2016 系统未验证 1.新建记事本,在记事本中输入netsh wlan set hostednetwork mode=allow ssid= ...
- 百万年薪python之路 -- 并发编程之 多进程二
1. 僵尸进程和孤儿进程 基于unix的环境(linux,macOS) 主进程需要等待子进程结束之后,主进程才结束 主进程时刻检测子进程的运行状态,当子进程结束之后,一段时间之内,将子进程进行回收. ...
- The usage of Markdown---表格
更新时间:2019.09.14 谈到怎么在Markdown中插入表格,其实只要熟知以下几点就可以了: 使用管道符|进行内容的分割 使用冒号:和连号符-表示表格内容的对齐情况,连号符-在中间,冒号: ...
- MAC idea&eclipse快捷键--笔记
idea: 1. command+d 删除行 2. command+o 重写父类方法 3. option+command+v 自动补全变量 4. 将普通java项目变成maven项目 在项目名称上点 ...
- Apache 4.x HttpClient
public static Map callRequest(String requestUrl, Method method, Map<String, String> data) thro ...
- Linux常用命令及示例(全)
NO 分类 PS1 命令名 用法及参数 功能注解1 显示目录信息 # ls ls -a 列出当前目录下的所有文件,包括以.头的隐含文件 # ls ls -l或ll 列出当前目录下文件的详细信息 # l ...