Java Class文件详解
Java Class文件中包含以下信息:
ClassFile {
u4 magic; //模数
u2 minor_version; //次版本号
u2 major_version; //主版本号
u2 constant_pool_count; //常量池大小
cp_info constant_pool[constant_pool_count-1]; //常量池
u2 access_flags; //类和接口层次的访问标志(通过|运算得到)
u2 this_class; //类索引(指向常量池中的类常量)
u2 super_class; //父类索引(指向常量池中的类常量)
u2 interfaces_count; //接口索引计数器
u2 interfaces[interfaces_count]; //接口索引集合
u2 fields_count; //字段数量计数器
field_info fields[fields_count]; //字段表集合
u2 methods_count; //方法数量计数器
method_info methods[methods_count]; //方法表集合
u2 attributes_count; //属性个数
attribute_info attributes[attributes_count]; //属性表
}
1. 通过实例来看
public interface InterA {
}
}
public class Sub extends Base implements InterB, InterC {
}
我们使用WinHex查看Sub类的.class文件:
2. 魔数
作用:确定该文件是否是虚拟机可接受的class文件。java的魔数统一为 0xCAFEBABE (来源于一款咖啡)。
区域:文件第0~3字节。
3. 版本号
作用:表示class文件的版本,由minorversion和majorversion组成。
区域:文件第4~7字节。
如
51代表,jdk为1.7.0
需要注意的是java版本号是从45开始的,大版本发布,主版本号+1.高版本的jdk能向下兼容以前版本的class文件,但不兼容以后版本的class文件。
4. 常量池
常量池的大小是不固定的,根据你的类中的常量的多少而定,所以在常量池的入口,放置了一个u2类型的表示常量池中常量个数的常量池容量计数器。计数器从1开始,第0位有特殊含义,表示指向常量池的索引值数据不引用任何一个常量池项目。池中的数据项就像数组一样是通过索引访问的。
我们可以清楚的看到,我们常量池中有63-1=62个常量。这些常量是什么呢?
要存放字面量Literal和符号引用Symbolic References。
字面量可能是文本字符串,或final的常量值。
符号引用包括以下:
- 类或接口全限定名 Full Qualified Name
- 字段名称和描述符 Descriptor
- 方法名称和描述符
我们使用反编译工具查看一下:
E:\program\JVM\bin\com\gissky\clazz>javap -v Sub.class
Classfile /E:/program/JVM/bin/com/gissky/clazz/Sub.class
Last modified 2015-2-22; size 1363 bytes
MD5 checksum 2dc77c79e4790422407eb7092085883c
Compiled from "Sub.java"
public class com.gissky.clazz.Sub extends com.gissky.clazz.Base implements com.gissky.clazz.InterB,com.gissky.clazz.InterC
SourceFile: "Sub.java"
minor version: 0
major version: 51
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Class #2 // com/gissky/clazz/Sub →类和接口的全限定名
#2 = Utf8 com/gissky/clazz/Sub
#3 = Class #4 // com/gissky/clazz/Base
#4 = Utf8 com/gissky/clazz/Base
#5 = Class #6 // com/gissky/clazz/InterB
#6 = Utf8 com/gissky/clazz/InterB
#7 = Class #8 // com/gissky/clazz/InterC
#8 = Utf8 com/gissky/clazz/InterC
#9 = Utf8 subInt
#10 = Utf8 I
#11 = Utf8 subString
#12 = Utf8 Ljava/lang/String;
#13 = Utf8 subObject
#14 = Utf8 Ljava/lang/Object;
#15 = Utf8 <init>
#16 = Utf8 ()V
#17 = Utf8 Code
#18 = Methodref #3.#19 // com/gissky/clazz/Base."<init>":()V
#19 = NameAndType #15:#16 // "<init>":()V
#20 = Utf8 LineNumberTable
#21 = Utf8 LocalVariableTable
#22 = Utf8 this
#23 = Utf8 Lcom/gissky/clazz/Sub;
#24 = Utf8 getSubInt
#25 = Utf8 ()I
#26 = Fieldref #1.#27 // com/gissky/clazz/Sub.subInt:I → 类中字段的符号引用
#27 = NameAndType #9:#10 // subInt:I → 类中字段的部分符号引用之名称和类型
#28 = Utf8 setSubInt
#29 = Utf8 (I)V
#30 = Utf8 getSubString
#31 = Utf8 ()Ljava/lang/String;
#32 = Fieldref #1.#33 // com/gissky/clazz/Sub.subString:Ljava/lang/String;
#33 = NameAndType #11:#12 // subString:Ljava/lang/String;
#34 = Utf8 setSubString
#35 = Utf8 (Ljava/lang/String;)V
#36 = Utf8 getSubObject
#37 = Utf8 ()Ljava/lang/Object;
#38 = Fieldref #1.#39 // com/gissky/clazz/Sub.subObject:Ljava/lang/Object;
#39 = NameAndType #13:#14 // subObject:Ljava/lang/Object;
#40 = Utf8 setSubObject
#41 = Utf8 (Ljava/lang/Object;)V
#42 = Utf8 interC
#43 = Fieldref #44.#46 // java/lang/System.out:Ljava/io/PrintStream;
#44 = Class #45 // java/lang/System
#45 = Utf8 java/lang/System
#46 = NameAndType #47:#48 // out:Ljava/io/PrintStream;
#47 = Utf8 out
#48 = Utf8 Ljava/io/PrintStream;
#49 = String #50 // the interC in Sub
#50 = Utf8 the interC in Sub
#51 = Methodref #52.#54 // java/io/PrintStream.println:(Ljava/lang/String;)V
#52 = Class #53 // java/io/PrintStream
#53 = Utf8 java/io/PrintStream
#54 = NameAndType #55:#35 // println:(Ljava/lang/String;)V
#55 = Utf8 println
#56 = Utf8 interB
#57 = Utf8 (I)Ljava/lang/String;
#58 = String #59 // the interB in Sub →方法中用到的String常量
#59 = Utf8 the interB in Sub
#60 = Utf8 i
#61 = Utf8 SourceFile
#62 = Utf8 Sub.java
常量池中的项目类型如下:
- CONSTANT_Utf8_info tag标志位为1, UTF-8编码的字符串
- CONSTANT_Integer_info tag标志位为3, 整形字面量
- CONSTANT_Float_info tag标志位为4, 浮点型字面量
- CONSTANT_Long_info tag标志位为5, 长整形字面量
- CONSTANT_Double_info tag标志位为6, 双精度字面量
- CONSTANT_Class_info tag标志位为7, 类或接口的符号引用
- CONSTANT_String_info tag标志位为8,字符串类型的字面量
- CONSTANT_Fieldref_info tag标志位为9, 字段的符号引用
- CONSTANT_Methodref_info tag标志位为10,类中方法的符号引用
- CONSTANT_InterfaceMethodref_info tag标志位为11, 接口中方法的符号引用
- CONSTANT_NameAndType_info tag 标志位为12,字段和方法的名称以及类型的符号引用
5. 类或接口访问标志
表示类或者接口方面的访问信息,比如Class表示的是类还是接口,是否为public、static、final等。,下面我们就来看看TestClass的访问标示。Class的访问标志值为0x0021:
根据前面说的各种访问标示的标志位,我们可以知道:0x0021=0x0001|0x0020 也即ACC_PUBLIC 和 ACC_SUPER为真,其中ACC_PUBLIC大家好理解,ACC_SUPER是jdk1.2之后编译的类都会带有的标志。
6. 类索引、父类索引与接口索引集合
Class文件中由这3项数据来确定类的继承关系。
类索引和父类索引都是指向常量池中的常量索引:
紧接着后面是一个接口的计数器和接口描述符:
7. 字段表集合
作用:描述接口或者类中声明的类变量以及实例变量,不包括方法中的局部变量。
紧接着接口索引集合之后的2字节是字段计数器:
表示我们类中有3个字段,这里便是subInt、subString、subObject 3个字段。紧接其后的是字段表,字段表结构为:
field_info
{
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
access_flags项的值是用于定义字段被访问权限和基础属性的掩码标志。取值范围如下表:
描述符标识字符含义:
V 表示特殊类型void。
对于数组类型,每一个维度将使用一个前置的”["字符来描述,如一个定义的"java.lang.String[][]“类型的二维数组,将被记录为:”[[Ljava/lang/String;",一个整型数组"int[]“将被记录为”[I"
父类中的字段不会出现在子类的字段表中。
8. 方法表集合
字段表集合结束后便是方法表集合。
作用:描述该类中的方法。
和字段表一样,使用一个u2类型的方法计数器,记录该类中方法的个数。
表示我们的类中有9个方法。
方法表的结构如下图所示
其中name_index和descriptor_index表示的是方法的名称和描述符,他们分别是指向常量池的索引。这里需要结解释一下方法的描述符,方法的描述符的结构为:(参数列表)返回值,比如public int instanceMethod(int param)的描述符为:(I)I,表示带有一个int类型参数且返回值也为int类型的方法,方法java.lang.String.toString()的描述符为"()Ljava/lang/String;",int IndexOf(char[] source,int sourceOffset,int sourceCount,char[] target int targetOffset,int targetCount,int fromIndex) 表示为([CII[CII)I。接下来就是属性数量以及属性表了,方法表和字段表虽然都有 属性数量和属性表,但是他们里面所包含的属性是不同。
如果父类方法在子类中没有被重写(@Override),方法表中就不会出现来自父类的方法信息。
9. 属性表集合
上面的方法表中我们就看到<init>方法有一个Code的属性。在本节我们将阐述这些属性:
Code属性:
该属性里主要存放由javac编译器处理后得到的字节码指令。
其中attribute_name_index指向常量池中值为Code的常量,attribute_length的长度表示Code属性表的长度(这里 需要注意的时候长度不包括attribute_name_index和attribute_length的6个字节的长度)。
max_stack表示最大栈深度,虚拟机在运行时根据这个值来分配栈帧中操作数的深度,而max_locals代表了局部变量表所需的存储空间。
max_locals的单位为slot,slot是虚拟机为局部变量分配内存的最小单元,在运行时,对于不超过32位类型的数据类型,比如 byte,char,int等占用1个slot,而double和Long这种64位的数据类型则需要分配2个slot,另外max_locals的值并不是所有局部变量所需要的内存数量之和,因为slot是可以重用的,当局部变量超过了它的作用域以后,局部变量所占用的slot就会被重用。方法参数、显示异常处理器的参数、方法体中定义的局部变量都要使用局部变量表来存放。
code_length代表了字节码指令的数量,而code表示的是字节码指令,从上图可以知道code的类型为u1,一个u1类型的取值为0x00-0xFF,对应的十进制为0-255,目前虚拟机规范已经定义了200多条指令。
exception_table_length以及exception_table分别代表方法对应的异常信息。
attributes_count和attribute_info分别表示了Code属性中的属性数量和属性表,从这里可以看出Class的文件结构中,属性表是很灵活的,它可以存在于Class文件,方法表,字段表以及Code属性中。
修改一下Sub中的InterB方法:
@Override
}
大家不妨先猜一下这个函数的结果是什么?假如在try块中发生异常,结构又是什么?我相信对Java语言熟悉的朋友,肯定知道答案。
使用反编译工具查看:
public int interB(int);
flags: ACC_PUBLIC
Code:
stack=2, locals=6, args_size=2
0: iconst_0
1: istore_2
2: iload_2
3: iload_1
4: iadd
5: istore_2
6: iload_2
7: istore 5
9: iconst_3
10: istore_2
11: iload 5
13: ireturn
14: astore_3
15: iconst_m1
16: istore_2
17: iload_2
18: istore 5
20: iconst_3
21: istore_2
22: iload 5
24: ireturn
25: astore 4
27: iconst_3
28: istore_2
29: aload 4
31: athrow
Exception table:
from to target type
2 9 14 Class java/lang/Exception
2 9 25 any
14 20 25 any
LineNumberTable:
line 35: 0
line 37: 2
line 38: 6
line 43: 9
line 38: 11
line 39: 14
line 40: 15
line 41: 17
line 43: 20
line 41: 22
line 42: 25
line 43: 27
line 44: 29
LocalVariableTable:
Start Length Slot Name Signature
0 32 0 this Lcom/gissky/clazz/Sub;
0 32 1 i I
2 30 2 x I
15 10 3 e Ljava/lang/Exception;
StackMapTable: number_of_entries = 2
frame_type = 255 /* full_frame */
offset_delta = 14
locals = [ class com/gissky/clazz/Sub, int, int ]
stack = [ class java/lang/Exception ]
frame_type = 74 /* same_locals_1_stack_item */
stack = [ class java/lang/Throwable ]
}
从 args_size=2这条反编译代码,我们可以知道,在public int interB(int i)这个方法中有6个局部变量,2个参数,可是我们的函数中明明只有一个参数么……这是因为编译器会为每一个实例函数包括构造器添加一个参数this,在JVM调用该方法的时候会该形参传递一个实参—方法所在对象的自身。
Exception table:
from to target type
2 9 14 Class java/lang/Exception
2 9 25 any
14 20 25 any
上表表头表示,当字节码在form行到to行(不包括to行)出现类型为type的异常,则转到第target行继续处理。
从方法的异常表中,我们可以看到这个函数有3条执行路径:
这里我们插入阐述一下LineNumberTable表的含义:它表示Java源码行号与字节码行号之间的对应关系。
知道了该方法执行的3条路径,我们也就知道刚才我们的那个问题有3个答案:没有异常是为x+i;try块中出现Exception类型的错误时,返回-1;出现Exception以外的任何异常方法非正常结束,没有返回值。
LocalVariableTable:
Start Length Slot Name Signature
0 32 0 this Lcom/gissky/clazz/Sub;
0 32 1 i I
2 30 2 x I
15 10 3 e Ljava/lang/Exception;
LocalVariableTable表示局部变量表,描述方法中局部变量。
如果你对返回的答案能理解的话,那么我相信你也肯定知道,我们函数中只有4个参数,但max_locals却等于6。不懂的话仔细看一下Code中字节码的执行过程变可以理解了。
一个方法在执行时需要多大的局部变量空间在编译时期就知道了,方法执行期间不会改变局部变量表的大小。
Signature 属性:
该属性是在JDK1.5新增的。该属性可用于类、属性表和方法表结构的属性表中。使用泛型签名如果包含了类型变量(Type Variables)或参数化类型(Parameterized Types),则Signature 属性会为它记录泛型签名信息。当我们要泛型类中拿到泛型的实际类型的时候非常有用。
实例:
在使用Hibernate时,我习惯将为Dao层封装一个泛型基类,来放置一些通用的方法,而Hibernate有很多方法都要传递一个POJO的类型,然后进行查询,如load方法。我们构建这样的一个基类:
public abstract class BaseDaoImpl<T, PK extends Serializable> extends HibernateDaoSupport implements BaseDao<T, PK>
那么load中要使用的POJO类型便是T的实际类型。怎么来那倒这个属性呢?这里边要使用到Signature属性了。
public abstract class BaseDaoImpl<T, PK extends Serializable> extends HibernateDaoSupport implements BaseDao<T, PK> {
}
}
Java Class文件详解的更多相关文章
- protobuf 编译 java js文件详解
首先下载protobuf.exe 下载地址:https://download.csdn.net/download/qq_34756156/10220137 MessageBody.proto synt ...
- Java自动化测试框架-12 - TestNG之xml文件详解篇 (详细教程)
1.简介 现在这篇,我们来学习TestNG.xml文件,前面我们已经知道,TestNG就是运行这个文件来执行测试用例的.通过本篇,你可以进一步了解到:这个文件是配置测试用例,测试套件.简单来说,利用这 ...
- Java 序列化Serializable详解
Java 序列化Serializable详解(附详细例子) Java 序列化Serializable详解(附详细例子) 1.什么是序列化和反序列化Serialization(序列化)是一种将对象以一连 ...
- web.xml文件详解
web.xml文件详解 Table of Contents 1 listener. filter.servlet 加载顺序 2 web.xml文件详解 3 相应元素配置 1 listener. f ...
- [转]AndroidManifest.xml文件详解
转自:http://www.cnblogs.com/greatverve/archive/2012/05/08/AndroidManifest-xml.html AndroidManifest.xml ...
- 最新java数组的详解
java中HashMap详解 http://alex09.iteye.com/blog/539545 总结: 1.就像引用类型的数组一样,当我们把 Java 对象放入数组之时,并不是真正的把 Java ...
- JAVA IO 类库详解
JAVA IO类库详解 一.InputStream类 1.表示字节输入流的所有类的超类,是一个抽象类. 2.类的方法 方法 参数 功能详述 InputStream 构造方法 available 如果用 ...
- 淘宝JAVA中间件Diamond详解(2)-原理介绍
淘宝JAVA中间件Diamond详解(二)---原理介绍 大家好,通过第一篇的快速使用,大家已经对diamond有了一个基本的了解.本次为大家带来的是diamond核心原理的介绍,主要包括server ...
- jni.h头文件详解二
作者:左少华 博客:http://blog.csdn.net/shaohuazuo/article/details/42932813 转载请注明出处:http://blog.csdn.net/shao ...
随机推荐
- Swift让编程更简单 人人都是开发者
全称为苹果全球开发者大会的WWDC,每年的这个时候,都会如这段时间前后所举行的Google I/O 和微软的BUILD开发者会议一样,吸引全球科技媒体的目光.近几年来,因为在会上爆的猛料越来越多,“开 ...
- Linux磁盘管理
本系列的博客来自于:http://www.92csz.com/study/linux/ 在此,感谢原作者提供的入门知识 这个系列的博客的目的在于将比较常用的liunx命令从作者的文章中摘录下来,供自己 ...
- MySQL 升级详细步骤 (包括 Percona)
MySQL 升级步骤 MySQL 5.1.72 升级到 MySQL 5.5.36 鉴于我在升级的时候遇到的麻烦问题,我觉得有必要把一些细节说清楚,免得引起误解了.感觉官方文档上的升级步骤写的比较简单, ...
- H5 缓存机制浅析 移动端 Web 加载性能优化
腾讯Bugly特约作者:贺辉超 1 H5 缓存机制介绍 H5,即 HTML5,是新一代的 HTML 标准,加入很多新的特性.离线存储(也可称为缓存机制)是其中一个非常重要的特性.H5 引入的离线存储, ...
- Java设计模式8:迭代器模式
迭代器模式 迭代器模式又叫做游标(Cursor)模式,其作用是提供一种方法访问一个容器元素中的各个对象,而又不暴露该对象的内部细节. 迭代器模式结构 迭代器模式由以下角色组成: 1.迭代器角色 负责定 ...
- 实战-Fluxion与wifi热点伪造、钓鱼、中间人攻击、wifi破解
原作者:PG 整理:玄魂工作室-荣杰 目录: 0x00-Fluxion是什么 0x01-Fluxion工作原理 0x02-Kali上安装fluxion 0x03-Fluxion工具使用说明+实 ...
- 《CLR.via.C#第三版》第二部分第4,5章节读书笔记(二)
这两章全是理论性的东西,我觉得不必过于钻牛角尖.理论这东西,只有在长期的实践中去慢慢领悟才会深刻.下面我只写些我认为重要的关键知识. (一)类型转换 知识点:向基类型的转换被认为是一种安全的隐式转换: ...
- Chrome扩展程序的二次开发:把它改得更适合自己使用
我当然知道未经作者允许修改别人程序是不道德的了,但作为学习研究之用还是无可厚非,这里仅供交流. 一切都是需求驱动的 话说某天我在网上猎奇的时候无意间发现这么一款神奇的谷歌浏览器插件:Extension ...
- Node.js~sails.js~package.json的作用
回到目录 我们在sails框架进行node.js开发时,会涉及到项目的迁移,当迁移后可能你的module即丢失,这时,希望快速的安装所有的包包,可以使用下面命令 1 cd 你当前的sails项目 2 ...
- 描述一下C#中索引器的实现过程,是否只能根据数字进行索引?
不是.可以用任意类型. 索引器是一种特殊的类成员,它能够让对象以类似数组的方式来存取,使程序看起来更为直观,更容易编写. 1.索引器的定义 C#中的类成员可以是任意类型,包括数组和集合.当一个类包含了 ...