泛型存在于Java源代码中,在编译为字节码文件之前都会进行泛型擦除(type erasure),因此,Java的泛型完全由Javac等编译器在编译期提供支持,可以理解为Java的一颗语法糖,这种方式实现的泛型有时也称为“伪泛型”。

泛型擦除本质上就是擦除与泛型相关的一切信息,例如参数化类型、类型变量等,Javac还将在需要时进行类型检查及强制类型转换,甚至在必要时会合成桥方法。

1、真假泛型

如果你是Java业务开发者,其实这种所谓的伪泛型已经达到了方便使用的目的,例如在容器的使用过程中,能够记住其类型,这样就不用在获取时专门做强制类型转换了,如下:

package cn.hotspotvm;

class Wrapper<T> {
public T data; public void setData(T data) {
this.data = data;
} public T getData(){
return data;
}
} public class TestGeneric {
public static void main(String[] args) {
Wrapper<Integer> p = new Wrapper<>();
p.setData(new Integer(2));
// 在获取的时候不用进行强制类型转换,直接用
// Integer接收即可
Integer data = p.getData();
System.out.println(data);
}
}

泛型尤其在我们使用容器类,如ArrayList、 HashMap等时能提供便利。

假设Java不支持泛型,那么我们针对Integer类型进行封装的Wrapper代码应该是如下的样子:

class Wrapper{
public int data; public void setData(int data) {
this.data = data;
} public Object getData(){
return data;
}
} public class TestGeneric {
public static void main(String[] args) {
Wrapper p = new Wrapper();
p.setData(2);
int data = p.getData();
System.out.println(data);
}
}

这个Wrapper明显是只能对int类型进行封装,不过其实现和之前比起来要简洁,不但实例字段内存占用减少,还没有了装箱和拆箱操作,也省去了强制类型转换。这也是我们在使用Java泛型时希望看到的版本。

以目前Java的实现来看,是对泛型进行擦除处理的,对Wrapper类型进行擦除后的代码如下所示。

class Wrapper{
public Object data; public void setData(Object data) {
this.data = data;
} public Object getData(){
return data;
}
} public class TestGeneric {
public static void main(String[] args) {
Wrapper p = new Wrapper();
p.setData(2);
// 必须进行强制类型转换为Integer
Integer data = (Integer)p.getData();
System.out.println(data);
}
}

由于在整个应用中,无论是Wrapper还是Wrapper这些类型来说,其Wrapper在虚拟机中只有一个版本,因为需要对任何的Java对象进行封装,所以声明为Object,当然如果你知道只会放某个更具体的类或这个类的子类时,也可以将Wrapper类型声明的更精确一些,如Wrapper。

假设像C++的模板类一样,Java的“真泛型”也为每一个具体的泛型生成一个独有的类(类型膨胀式泛型),那么就如下图所示。

可以看到,真泛型会针对具体的类型生成独有的类型。针对Wrapper就应该有是这样:

class Wrapper{
public Integer data; public void setData(Integer data) {
this.data = data;
} public Integer getData(){
return data;
}
} public class TestGeneric {
public static void main(String[] args) {
Wrapper p = new Wrapper();
p.setData(2);
Integer data = p.getData();
System.out.println(data);
}
}

这次类型非常精确,也没有了强制类型转换。不过与我们理想中的还有差距,主要是没有将Wrapper中的类型声明为基本类型int,这会导致装箱和拆箱操作。在Java中,装箱和拆箱操作很频繁,为此JDK开发人员也在努力优化,如延迟装箱等,现在,Project Valhalla要让泛型能支持原始类型。好在除非是专门做优化的人,否则一般开发者也不会注意到这种装箱和拆箱的开销。

这里还要说的是,由于对象和基本类型找不到一个共同的父类,所以在泛型擦除时只能是对象类型,也就是说,我们不能在Java中写一个类似Wrapper这样的声明。这篇文章我们暂时不讨论这个问题,我们讨论另外一个重要的问题,也就是为任何一个泛型生成一个真正的类与这种伪泛型的擦除之间会造成哪些性能影响?

2、性能影响

我们举几个小例子来看一下:

实例1

class SpecWrapper extends Wrapper<Integer> {
public void setData(Integer data) { }
}

我们自定义了一个对Integer类封装的SpecWrapper类,这个类在泛型擦除后如下所示。

class SpecWrapper extends Wrapper {
public void setData(Integer data) { } /*synthetic*/ public void setData(Object x0) { // 合成的桥方法
this.setData((Integer)x0);
}
}

在泛型擦除后,Wrapper类的setData()方法的类型变量T被替换为Object类型,这样SpecWrapper类中的setData(Integer data)并没有覆写这个方法,所以为了覆写特性,向SpecWrapper类中添加一个合成的桥方法setData(Objext x0)。

这会让我们在实际调用setData()方法时调用的是setData(Object x0)方法,这个方法又调用了setData(Integer data)方法,而在“真泛型”中,我们直接调用setData(Integer data)方法即可,虽然JIT会大概率对这种简单的方法进行内联,但是性能影响肯定是有的。

实例2

class Parent {
public static int a = 0;
public void invoke() {
a = 1;
}
} final class Sub1 extends Parent {
public void invoke() {
a = 2;
}
} public class TestGeneric<T extends Parent> {
T t; public TestGeneric(T t1) {
this.t = t1;
} public static void main(String[] args)
throws InterruptedException {
TestGeneric<Sub1> s
= new TestGeneric<>(new Sub1());
// 调用test()方法超过一定次数会分别触发C1和C2编译
for (int i = 0; i < 100000; i++) {
s.test();
}
// 等待异常的编译线程编译完并打印结果
Thread.sleep(10000);
} public void test() {
t.invoke();
}
}

我们关注一下test()方法中的t.invoke()动态分派,通过泛型擦除之后,TestGeneric类中的T是Parent类型,那么test()方法中t声明的类型就是Parent,如下:

public class TestGeneric{
Parent t; public TestGeneric(Parent t1) {
this.t = t1;
} public void test() {
t.invoke();
}
}

配置如下命令查看C2编译的结果:

XX:CompileCommand=compileonly,cn/hotspotvm/TestGeneric::test -XX:CompileCommand=print,cn/hotspotvm/TestGeneric::test

C2编译的版本出来如下:

  0x000070e6e00aa915: cmp    $0xf800c184,%r8d   ;   {metadata('cn/hotspotvm/Sub1')}
0x000070e6e00aa91c: jne 0x000070e6e00aa934
0x000070e6e00aa91e: lea (%r12,%r10,8),%rsi
0x000070e6e00aa922: nop
0x000070e6e00aa923: callq 0x000070e6dfe45e60 ; OopMap{off=72}
;*invokevirtual invoke
; - cn.hotspotvm.TestGeneric::test@4 (line 39)
; {optimized virtual_call}
0x000070e6e00aa928: add $0x10,%rsp
0x000070e6e00aa92c: pop %rbp
0x000070e6e00aa92d: test %eax,0x165cb6cd(%rip) # 0x000070e6f6676000
; {poll_return}
0x000070e6e00aa933: retq
0x000070e6e00aa934: mov $0xffffffde,%esi
0x000070e6e00aa939: mov %r10d,%ebp
0x000070e6e00aa93c: data32 xchg %ax,%ax
0x000070e6e00aa93f: callq 0x000070e6dfe45460 ; OopMap{rbp=NarrowOop off=100}
;*invokevirtual invoke
; - cn.hotspotvm.TestGeneric::test@4 (line 39)
; {runtime_call}

也就等同于如下:

if(t是Sub1类型){
直接调用Sub1的invoke()方法,也就是optimized virtual_call的意思
}else{
动态分派,通过查找方法表来实现调用,也就是invokevirtual invoke的意思
}

C2实际是通过运行时采样,发现t的类型只有Sub1,所以做了这样的优化,将动态分派优化为了一次比较+一次直接调用的开销。  

假设是“真泛型”上场,那TestGeneric应该是如下的样子:

public class TestGeneric{
Sub1 t; public TestGeneric(Sub1 t1) {
this.t = t1;
} public void test() {
t.invoke();
}
}

此时C2编译出来的版本如下:

  0x000074bd840b7b5b: callq  0x000074bd83e45e60  ; OopMap{off=64}
;*invokevirtual invoke
; - cn.hotspotvm.TestGeneric::test@4 (line 39)
; {optimized virtual_call}

直接就是直调,比之前省了一次判断,代码很简洁。因为C2得到了t的更精确类型Sub1,并且这个Sub1还是final修饰的类,不会有子类,所以直接调用即可。

虽然少量调用可能并不能体现出来差异,更何况现在的C2优化实在强大,使得它们的性能差异可能只在极少数的情况下才能体现出来。

C2编译器非常喜欢精确类型,这样在类型传播的过程中能触发许多优化,编译出性能更好的版本,后续我们在介绍C2时,看一看其类型传播,就能深刻体会到它的强大。 

实例3

假设有这么一个方法,实现如下:

class Parent{
// ...
} find class Sub1 extends Parent{
// ...
} class Sub2 extends Parent{
// ...
} public class Wrapper<T extends Parent>{
public void test(T t){
if(t instanceof Sub1){
// 执行Sub1的逻辑
}else if( t instanceof Sub2){
// 执行Sub2的逻辑
}else{
// 执行其它类型的逻辑 
}
}
}

对于伪泛型来说,擦除后,T是Parent类型。方法test(Parent t)无法做任何优化。

对于真泛型来说,至少Wrapper和Wrapper版本中的test()是可以优化的。

public void test(Sub1 t)版本中只需要直接执行Sub1的逻辑就可以,并不需要判断,因为Sub1是final类,所以t只能是Sub1类型,如下:

public void test(Sub1 t){
执行Sub1的逻辑
}

public void test(Sub2 t)版本中只需要直接执行Sub2的逻辑就可以,并不需要判断,虽然Sub2是非final类型,但是经过类层次分析后发现,Sub2没有具体的实现子类,那这时候也能认为这个版本只有Sub2类型。

public void test(Sub2 t){
执行Sub2的逻辑
}

如果你想了解下Java为啥不支持这种类型的泛型,可以参考

R大在知乎的回答

简单来说,就是为了高版本的兼容性做了一种妥协的策略而已。

更多文章可访问:JDK源码剖析网

Java的"伪泛型"变"真泛型"后,会对性能有帮助吗?的更多相关文章

  1. 重读《深入理解Java虚拟机》六、Java泛型 VS C#泛型 (伪泛型 VS 真泛型)

    一.泛型的本质 泛型是参数化类型的应用,操作的数据类型不限定于特定类型,可以根据实际需要设置不同的数据类型,以实现代码复用. 二.Java泛型 Java 泛型是Java1.5新增的特性,JVM并不支持 ...

  2. C#的泛型和Java的伪泛型

    C#的泛型和java的伪泛型,talk is cheap,show me the code   C#泛型 下面结果,C#里面会输出false,如果这个还不能真正的说明C#的泛型是真的泛型,那就看下面这 ...

  3. Java 集合、Iterator迭代器、泛型等

    01集合使用的回顾 A:集合使用的回顾 a.ArrayList集合存储5个int类型元素 public static void main(String[] args) { ArrayList<I ...

  4. Java中泛型区别以及泛型擦除详解

    一.引言 复习javac的编译过程中的解语法糖的时候看见了泛型擦除中的举例,网上的资料大多比较散各针对性不一,在此做出自己的一些详细且易懂的总结. 二.泛型简介 泛型是JDK 1.5的一项新特性,一种 ...

  5. 《徐徐道来话Java》(2):泛型和数组,以及Java是如何实现泛型的

    数组和泛型容器有什么区别 要区分数组和泛型容器的功能,这里先要理解三个概念:协变性(covariance).逆变性(contravariance)和无关性(invariant). 若类A是类B的子类, ...

  6. 《徐徐道来话Java》(1):泛型的基本概念

    泛型是一种编程范式(Programming Paradigm),是为了效率和重用性产生的.由Alexander Stepanov(C++标准库主要设计师)和David Musser(伦斯勒理工学院CS ...

  7. Java泛型总结——吃透泛型开发

    什么是泛型 泛型是jdk5引入的类型机制,就是将类型参数化,它是早在1999年就制定的jsr14的实现. 泛型机制将类型转换时的类型检查从运行时提前到了编译时,使用泛型编写的代码比杂乱的使用objec ...

  8. java反射--通过反射了解集合泛型的本质

    通过Class,Method来认识泛型的本质 package com.reflect; import java.lang.reflect.Method; import java.util.ArrayL ...

  9. Java 泛型 五:泛型与数组

    简介 上一篇文章介绍了泛型的基本用法以及类型擦除的问题,现在来看看泛型和数组的关系.数组相比于Java 类库中的容器类是比较特殊的,主要体现在三个方面: 数组创建后大小便固定,但效率更高 数组能追踪它 ...

  10. 夯实Java基础(十八)——泛型

    1.什么是泛型 泛型是Java1.5中出现的新特性,也是最重要的一个特性.泛型的本质是参数化类型,也就是说所操作的数据类型被指定为一个参数.这种参数类型可以用在类.接口和方法的创建中,分别称为泛型类. ...

随机推荐

  1. 大模型工具KTransformer的安装

    技术背景 前面写过几篇关于DeepSeek的文章,里面包含了通过Ollama来加载模型,以及通过llama.cpp来量化模型(实际上Llama.cpp也可以用来加载模型,功能类似于Ollama).这里 ...

  2. Android高版本Service在后台一分钟被杀死

    最近公司出现了一个Bug,Service在后台写log时候一分钟左右被杀死,或者运行一会就被杀死了,上网搜了一下原来是Android高版本为了保护电量,流量什么的,会在后台杀死这些Service,现在 ...

  3. QT5笔记: 14. SpinBox的常用功能

    例子: #include "widget.h" #include "ui_widget.h" Widget::Widget(QWidget *parent) : ...

  4. luogu-P10596题解

    简要题意 一个有 \(N\) 个元素的集合有 \(2N\) 个不同子集(包含空集),现在要在这 \(2N\) 个集合中取出若干集合(至少一个),使得它们的交集的元素个数为 \(K\),求取法的方案数, ...

  5. postgresql使用for循环

    开发过程中经常需要制造一些测试数据,sqlserver等数据库都有循环执行语句的方式,postgresql也可以使用for循环插入数据 do $$ begin for tt in 1..99 loop ...

  6. C#方法练习

    提示用户输入用户名和密码,写一个方法来判断用户输入的是否正确,返回给用户一个登陆结果,并且还要单独的返回给用户一个登陆信息 ,如果用户名错误,除了返回登陆结果之外,还要返回一个 "用户名错误 ...

  7. C语言 链表操作

    #include<stdio.h>#include<stdlib.h>struct node{    int data;    struct node *next;};int ...

  8. Linux下yum安装mysql 遇到的问题Can't open and lock privilege tables: Table 'mysql.user' doesn't exist 错误

    今天在linux下安装mysql时 执行service mysqld start时, mysql总是启动失败 后来查看mysql日志:/var/log/mysqld.log,发现有个Can't ope ...

  9. uniapp vue3 setup + 云开发开发个人小程序

    最近使用uniapp vue3 setup + 云开发开发了个人小程序,设计使用figma软件,看下成品截图吧(可以直接微信搜索[识光]小程序体验,或者最底部有码可以直接扫)

  10. ModuleNotFoundError: No module named '_lzma' when building python

    前言 运行 python 报错:ModuleNotFoundError: No module named '_lzma' when building python 解决 sudo apt-get in ...