Java之字节码(3) - 简单介绍
首先了解一下理论知识:
字节码:
Class文件是8位字节流,按字节对齐。之所以称为字节码,是因为每条指令都只占据一个字节,所有的操作码和操作数都是按字节对齐的。如:0×03表示iconst_0
Class文件的头4个字节称为魔数(Magic Number),它的唯一作用是用于确认该文件是否是能被JVM接受的Class文件。魔数值为:0xCAFEBABE。
紧接着魔数的4个字节是Class文件的版本号:第5和第6字节是次版本号(Minor Version),第7和第8字节是主版本号(Major Version)。Java的版本号从45开始的,JDK6的版本号是50。
javap –verbose class文件,查看字节码内容
全限定名:把类全名中的“.”替换成“/”最后加入一个“;”表示结束。如com/test/TestClass;
描述符:基本类型及void用大写字符表示,对象类型用字符L加对象的全限定名表示。
标识字符 | 含义 |
B | 基本类型byte |
C | char |
D | double |
F | float |
I | int |
J | long |
S | short |
Z | boolean |
V | void |
L | 对象类型,如Ljava/lang/Object; |
对于数组类型,每一维度将使用一个前置的“[”字符来描述,如定义一个“java.lang.String[][]”类型的二维数组,将被记录为:“[[Ljava/lang/String;”,一个整型数组“int[]”将被记录为“[I”.
用描述符来描述方法时,按照先参数列表,后返回值的顺序描述,参数列表按照参数的严格顺序放在一组小括号“( )”之内,如方法void inc()的描述符为“( )V”,方法java.lang.String toString() 的描述符合为“( )Ljava/lang/String;”,方法int indexOf(char[] source, int sourceOffset,int sourceCount, char[] target, int targetOffset, int targetCount, int fromIndex)的描述符为“([CII[CIII)I”
类构造器“<clinit>”方法,实例构造器“<init>”
JVM中最基本的数据单元是字,字长必须足够大,至少一个字长足以持有byte、short、int等的值,2个字长足以持有long、double的值,字长可以选择32位或者64位。
字长是CPU的主要技术指标之一,指的是CPU一次能并行处理的二进制位数,字长总是8的整数倍,通常PC机的字长为16位(早期),32位,64位。
栈帧的2个部分:局部变量区和操作数栈,是按字来定义的。当把值放入局部变量区或者操作数栈时,它将占有1个或2个字单元。
每启动一个新线程,JVM都为它分配一个Java栈,Java栈以帧为单位保存线程的运行状态,JVM对Java栈执行2种操作:以帧为单位的压栈和出栈。
每当线程调用一个Java方法时,JVM会在线程的Java栈中压入一个新帧,而这个新帧也成了当前帧,当执行这个方法时,它使用这个帧来存储参数、局部变量、中间运算结果等数据。
Java方法有2种方式完成,一种通过return返回,一种通过抛出异常中止,不管那种方式,JVM都将当前帧弹出Java栈然后释放掉,这样上一个方法的帧就成为当前帧了。
Java栈上的所有数据都是此线程私有的,任何线程都不能访问另一个线程的栈数据,因此栈数据是线程安全的。
栈帧由3部分组成:局部变量区、操作数栈、帧数据区。
局部变量区和操作数栈是以字长(32位)为单位的数组。
局部变量区包含方法的参数和局部变量,编译器首先按把这些参数放入局部变量数组。Java栈帧的局部变量区被组织为一个以字长为单位,从0开始计数 的数组。字节码指令通过从0开始的索引来使用其中的数据,如iload_1(把局部变量区的第2个变量压入栈顶),byte、short、int等的值在 数组中只占据1项,而long、double的值在数组中占据连续的2项。
操作数栈:和局部变量区一样,操作数栈也是被组织成一个以字长为单位的数组,但是它不是通过索引来访问,而是通过标志的栈操作:压栈和出栈来访问的。如iadd指令,从操作数栈中弹出2个整数,执行加法运算,然后将其结果压回操作数栈。
iload_0 //将局部变量区的第1个变量压入栈
iload_1 //将局部变量区的第2个变量压入栈
iadd //栈中弹出2个整数,执行加法运算,然后将其结果压回操作数栈
istore_2 //将栈顶的整数出栈,并存入局部变量区的第3个变量
一般读取局部变量区的数据,需要把局部变量区的变量压入栈,
把值写到局部变量区,也需要先压入栈,再写到局部变量区
帧数据区:存放常量池(要访问的类、字段、方法名等),异常表等数据。
LineNumberTable:字节码偏移量与源代码之间的映射关系。
常见指令:iload_1, istore_1, iconst_1, ldc, bipush, pop, dup, iadd, isub, imul, idiv, return, goto,invoke…, new, newarray, arraylength, instanceof,athrow,monitorenter, monitorexit
然后用字节码了解一下JVM的语法糖:
语法糖:
泛型、自动装箱、自动拆箱、循环遍历、变长参数、条件编译、内部类、枚举类、断言语句、对枚举的switch
类型擦除:
public class TestCls3
{//编译失败,因为List<String>和List<Integer>的泛型被擦除,变成原生类型List
public static void method(List<String> list)
{
System.out.println("invoke method1");
}
public static void method(List<Integer> list)
{
System.out.println("invoke method2");
}
}
public class TestCls3
{//可以执行,因为在Class文件中,只有描述符不完全一致的两个方法就可以共存
//也就是说两个方法如果有相同的名称和特征签名,但返回值不同,也是可以共存在一个Class文件的
public static String method(List<String> list)
{
System.out.println("invoke method1");
return "";
}
public static int method(List<Integer> list)
{
System.out.println("invoke method2");
return 1;
}
public static void main(String[] args)
{
method(new ArrayList<String>());
method(new ArrayList<Integer>());
}
}
javap –verbose demo.TestCls3
Constant pool:
const #17 = Asciz (Ljava/util/List<Ljava/lang/String;>;)Ljava/lang/String;
;
const #39 = Asciz (Ljava/util/List<Ljava/lang/Integer;>;)I;
public static java.lang.String method(java.util.List); //方法名擦除为List
Signature: length = 0×2
00 11 //指到常量池中的第17
public static int method(java.util.List); //方法名擦除为List
Signature: length = 0×2
00 27 //指到常量池中的第39
类型擦除,仅仅对方法的Code属性中的字节码进行擦除,元数据Signature还是保留了泛型数据。(Method类的signature变量)
Java的条件编译
只有条件为常量且只有if语句才能有这种效果
public class TestCls5
{
public static void main(String[] args)
{
if (true)
{
System.out.println(“true”);
}
else
{
System.out.println(“false”);
}
}
}
编译后的字节码只包含:System.out.println(“true”);
public class TestCls5
{
public static void main(String[] args)
{
System.out.println(“true”);
}
}
自增++操作的线程非安全:
public class TestCls5
{
private static volatile int count;
public static void main(String[] args)
{
count++;
}
}
对应字节码(分为4个指令,在多线程下访问可能出现脏数据):
Code:
0: getstatic #18; //Field count:I 获取指定类的静态域,并将其值压入栈顶
3: iconst_1 将整型常量1压入栈顶
4: iadd 将栈顶的2个值出栈并相加,然后将结果入栈顶
5: putstatic #18; //Field count:I 为指定的类的静态域赋值
8: return 方法返回
字符串的+操作(javac编译器会对String连接做自动优化):
public String constractStr(String str1, String str2, String str3)
{
return str1 + str2 + str3;
}
对应字节码(JDK1.5之后转换为调用StringBuilder.append方法):
Code:
0: new #24; //class java/lang/StringBuilder
3: dup
4: aload_1
5: invokestatic #26; //Method java/lang/String.valueOf:(Ljava/lang/Objec
t;)Ljava/lang/String;
8: invokespecial #32; //Method java/lang/StringBuilder.”<init>”:(Ljava/la
ng/String;)V
11: aload_2
12: invokevirtual #35; //Method java/lang/StringBuilder.append:(Ljava/lang
/String;)Ljava/lang/StringBuilder;
15: aload_3
16: invokevirtual #35; //Method java/lang/StringBuilder.append:(Ljava/lang
/String;)Ljava/lang/StringBuilder; ――调用StringBuilder的append方法
19: invokevirtual #39; //Method java/lang/StringBuilder.toString:()Ljava/l
ang/String;
22: areturn ――返回引用
public String constractStr()
{
return “str1″ + “str2″ + “str3″;
}
对应的字节码:
Code:
0: ldc #24; //String str1str2str3 –将字符串常量压入栈顶
2: areturn
public String constractStr(String str3)
{
return “str1″ + “str2″ + str3;
}
对应的字节码:
Code:
0: new #24; //class java/lang/StringBuilder
3: dup
4: ldc #26; //String str1str2 –将字符串常量str1str2压入栈顶
6: invokespecial #28; //Method java/lang/StringBuilder.”<init>”:(Ljava/la
ng/String;)V
9: aload_1
10: invokevirtual #31; //Method java/lang/StringBuilder.append:(Ljava/lang
/String;)Ljava/lang/StringBuilder; ――调用StringBuilder的append方法
13: invokevirtual #35; //Method java/lang/StringBuilder.toString:()Ljava/l
ang/String;
16: areturn
Java之字节码(3) - 简单介绍的更多相关文章
- 使用java动态字节码技术简单实现arthas的trace功能。
参考资料 ASM 系列详细教程 编译时,找不到asm依赖 用过[Arthas]的都知道,Arthas是alibaba开源的一个非常强大的Java诊断工具. 不管是线上还是线下,我们都可以用Arthas ...
- 【java虚拟机系列】从java虚拟机字节码执行引擎的执行过程来彻底理解java的多态性
我们知道面向对象语言的三大特点之一就是多态性,而java作为一种面向对象的语言,自然也满足多态性,我们也知道java中的多态包括重载与重写,我们也知道在C++中动态多态是通过虚函数来实现的,而虚函数是 ...
- java虚拟机字节码执行引擎
定义 java虚拟机字节码执行引擎是jvm最核心的组成部分之一,它做的事情很简单:输入的是字节码文件,处理过程是字节码解析的等效过程,输出的是执行结果.在不同的虚拟机实现里,执行引擎在执行java代码 ...
- 小师妹学JVM之:java的字节码byte code简介
目录 简介 Byte Code的作用 查看Byte Code字节码 java Byte Code是怎么工作的 总结 简介 Byte Code也叫做字节码,是连接java源代码和JVM的桥梁,源代码编译 ...
- 聊聊Java的字节码
本文为作者原创,转载请注明出处(http://www.cnblogs.com/mar-q/)by 负赑屃 巴山楚水凄凉地,二十三年弃置身.怀旧空吟闻笛赋,到乡翻似烂柯人.沉舟侧畔千帆过,病树前头万木春 ...
- java class 字节码
java class 字节码 协议: class文件 魔数(Magic):4byte -> 0xCAFEBABE 类似2f3f 版本(Version):4Byte -> 0x0000003 ...
- Java 动态字节码技术
对 Debug 的好奇 初学 Java 时,我对 IDEA 的 Debug 非常好奇,不止是它能查看断点的上下文环境,更神奇的是我可以在断点处使用它的 Evaluate 功能直接执行某些命令,进行一些 ...
- Java静态检测工具/Java代码规范和质量检查简单介绍(转)
静态检查: 静态测试包括代码检查.静态结构分析.代码质量度量等.它可以由人工进行,充分发挥人的逻辑思维优势,也可以借助软件工具自动进行.代码检查代码检查包括代码走查.桌面检查.代码审查等,主要检查代码 ...
- Java虚拟机--字节码指令集
1. 字节码指令集简介: Java虚拟机的指令由一个字节长度的,代表着某种特定操作含义的操作码(Opcode)以及跟随其后的零至多个代表此操作所需参数的操作数(Operands)所构成.虚拟机中许多指 ...
随机推荐
- adroid swipeRefreshLayout无法显示进度条的问题
一句话经验:必须嵌套scrollerview或者listview
- bzoj 2038 小z的袜子 莫队例题
莫队,利用可以快速地通过一个问题的答案得到另一问题的答案这一特性,合理地组织问题的求解顺序,将已解决的问题帮助解决当前问题,来优化时间复杂度. 典型用法:处理静态(无修改)离线区间查询问题. 线段树也 ...
- linux系统相关、硬件、资源 - 相关命令
分类命令: 1.1.系统 # uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本 # ...
- busdog is a filter driver for MS Windows (XP and above) to sniff USB traffic.
https://code.google.com/p/busdog/ busdog is a filter driver for MS Windows (XP and above) to sniff U ...
- ubuntu下从源码编译安装cherokee
apt-get install automake autoconf libtool rrdtool libpam0g-dev libssl-dev libgeoip-dev libldap2-dev ...
- GCC安装UBUNTU
在Ubuntu下安装GCC和其他一些Linux系统有点不一样. 方法一: 该方法超简单:sudo apt-get build-depgcc 就上面这条命令就可以搞定 方法二:sudo apt-get ...
- .net平台借助第三方推送服务在推送Android消息(极光推送)
最近做的.net项目(Windows Service)需要向Android手机发送推送消息,真是有点困难,没有搞过就不停的搜文档,最后看到了一个开源项目PushSharp,可以在.net平台推送IOS ...
- C#方法中的ref和out
ref 通常我们向方法中传递的是值.方法获得的是这些值的一个拷贝,然后使用这些拷贝,当方法运行完毕后,这些拷贝将被丢弃,而原来的值不将受到影响.此外我们还有其他向方法传递参数的形式,引用 ...
- 二十道经典C#面试题
1.在下面的代码中,如何引用命名空间fabulous中的great? namespace fabulous{// code in fabulous namespace}namespace super{ ...
- 关于导出数据库提示 outfile disabled的解决方案
使用命令mysqldump进行导出数据到本地磁盘,执行该命令的时候不要进入mysql的控制台再使用,这样会报outfiledisabled错误.而是直接使用MYSQL/bin目录下的mysqldump ...