C++指针和地址偏移在HotSpot VM中的应用

在前面我们介绍过new运算符，这个操作实际上上包含了如下3个步骤：

调用operator new的标准库函数。此函数会分配一块内存空间以便函存储相应类型的实例。
调用相应类的构造函数
返回一个指向该对象的指针

在第一步中，其实我们可以自己写个operator new函数对标准库函数进行重载，通常会根据类信息分配出需要的内存大小，但是分配内存的逻辑现在由我们自己控制，那我们就可以多分配一些内存，然后在多分配出来的内存上存储一些额外定义的信息。例如：

class Test {

private:

    int a = 1;

public:

    void *operator new(size_t requested_size) throw() {

        return ::malloc(requested_size);

    }

    void *operator new(size_t requested_size, size_t length) throw() {

        return ::malloc(requested_size + length);

    }

    long access_a_offset() {

        return (size_t) ((intptr_t) &(((Test *) 16)->a) - 16);

    }

    u_char *start_b_address() {

        return (u_char *) this + 4;

    }

    void set_b_value(long val) {

        *start_b_address() = val;

    }

    long get_b_value() {

        return (long) (*start_b_address());

    }

};

我们重载了new运算符，第一个重载函数会分配类实例本来需要的内存大小，而第二个重载函数多分配了length个字节的大小。举个具体使用的例子，如下：　

std::cout << sizeof(Test) << std::endl;

// 调用第一个operator new函数，分配的内存大小为8，用来存储变量

Test *t1 = new Test();

// 调用第二个operator new函数，分配的内存大小为16，用来存储变量外，还有空闲的8字节

Test *t2 = new (8) Test();

std::cout << t2->access_a_offset() << std::endl;

t2->set_b_value(10);

std::cout << t2->get_b_value() << std::endl;

最终打印的值为0 10

如上的例子在内存末尾多开辟了8字节用来存储long类型的数据，因为这个数据没有对应的属性用来直接存取，所以只能通过偏移来操作。

注意：我们通过this获取到当前实例内存的首地址时，必须要强制转换为u_char*类型，这样加4后才会移动4个字节，因为u_char占用一个字节，此时的指针指向u_char数据类型。其实还可以这样获取：

(u_char *) (this + 1)

this指向的是Test类型，加1后指针本身占用的内存大小的末尾，将其强制转换为指向u_char类型的指针即可。

在HotSpot VM中也有这样的操作，例如Method，根据需要有两个可选择性的字段，如下：

根据Method决定是否要多开辟内存来存储native_function和signature_handler，源代码如下：

int size = Method::size(access_flags.is_native());

return new (loader_data, size, false, MetaspaceObj::MethodType, THREAD) Method(cm, access_flags, size);

当为本地方法时，会为Method多开辟2 个指针大小的存储空间，然后使用new关键字创建对象。这里也重载了new运算符从指定的元数据区分配内存。　　

下面来看对这两个伪字段（不能通过类中的实例字段进行存取操作，但是又确实存在）的存取操作。

typedef   u_char*       address;

address* native_function_addr() const {

	  assert(is_native(), "must be native");

	  return (address*) (this+1);

}

address* signature_handler_addr() const {

	  return native_function_addr() + 1;

}

获取两个伪字段的地址。

注意这里的this+1，因为this的类型是Method实例，所以加1并不是加一个字节而是增加一个Method对应的字节数，即获取Method对应内存区域的下一个字节的地址；第二个native_function_addr() + 1，因为native_function_addr()返回的就是一个指针类型的数据，所以这里的加1是增加指针对应的字节数，64位下是8字节。

返回的类型为u_char**，也就是返回一个指向指针的指针。当我们要存储本地函数地址时，可如下操作：

// 读取操作

address current = *native_function;

// 存储操作

*native_function = function

其中的function的类型为address。

下面继续看偏移量的操作，HotSpot VM中经常做的操作就是计算某个变量的偏移量。例如定义的用来表示Java类的C++类Klass中有如下2个函数：

static ByteSize access_flags_offset(){

  return in_ByteSize(offset_of(Klass, _access_flags));

}

其中的_access_flags属性就是定义在Klass中的，通过调用access_flags_offset()函数来计算这个属性在类中的偏移量。offset_of是一个宏，如下：

#define offset_of(klass,field) (size_t)((intx)&(((klass*)16)->field) - 16)

经过宏替换和格式调整后的方法如下：

static ByteSize access_flags_offset(){

  return in_ByteSize((size_t)(

     (intx)&(  ((Klass*)16)->_access_flags) - 16

  ));

}

通过 (intx)&(((Klass*)16)->_access_flags) - 16 方式来计算出具体的偏移量。解释一下这种写法。

假如定义个变量Klass a; 我们都知道&a表示变量a的首地址，&(a._access_flags)表示变量_access_flags的地址，那么&(a._access_flags)减去&a就得到_access_flags的偏移量。

((Klass*)16)的地址为16，所以偏移量最终等于&( ((Klass*)16)->_access_flags)减去16。

当HotSpot VM要用一个成员变量的时候，它会根据对象的首地址加上成员的偏移量得到成员变量的地址。当对象的首地址为0时，得到的成员变量地址就是它的偏移量。

本人最近准备出一个手写Hotspot VM的课程，超级硬核，从0开始写HotSpot VM，将HotSpot VM所有核心的实现全部走一遍，如感兴趣，速速入群。

群里可讨论虚拟机和Java性能剖析与故障诊断等话题，欢迎加入。

C++指针和地址偏移在HotSpot VM中的应用的更多相关文章

JVM详解之:HotSpot VM中的Intrinsic methods
目录简介什么是Intrinsic Methods 内置方法的特点多样性兼容性 java语义的扩展 Hotspot VM中的内置方法 intrinsic方法和内联方法 intrinsic方法的实 ...
HotSpot VM 中的JIT分类
在HotSpot VM中内嵌有两个JIT编译器,分别为Client Compiler和Server Compiler,但大多数情况下我们简称为C1编译器和C2编译器.开发人员可以通过如下命令显式指定J ...
014-通过JDB调试，通过HSDB来查看HotSpot VM的运行时数据
一.JDB调试在预发环境下进行debug时,时常因为工具和环境的限制,导致debug体验非常差,那么有什么方法能够简化我们进行debug的体验吗?JDB就是一种. JDB ...
HotSpot VM运行时
HotSpot VM运行时系统为HotSpot JIT编译器和垃圾收集器提供服务和通用API,同时还为VM提供启动.线程管理.JNI(Java本地接口)等基本功能.HotSpot VM运行时环境担当许 ...
转：什么是即时编译（JIT）！？OpenJDK HotSpot VM剖析
重点应用程序可以选择一个适当的即时编译器来进行接近机器级的性能优化. 分层编译由五层编译构成. 分层编译提供了极好的启动性能,并指导编译的下一层编译器提供高性能优化. 提供即时编译相关诊断信息的JV ...
c++入门之出话指针和地址。
指针和地址是c和c++中重要的概念,在此,对指针做以下几方面的总结: new和delete: ]; point[] = ; point[] = ; point[] = ; cout << ...
[转]HotSpot VM GC 的种类
原文地址:http://www.cnblogs.com/redcreen/archive/2011/05/04/2037029.html collector种类 GC在 HotSpot VM 5.0里 ...
HotSpot VM垃圾收集器
最常用的HotSpot VM垃圾收集器是分代垃圾收集.该方案是基于两个观察事实. 大多数分配对象的存活时间很短. 存活时间久的对象很少引用存活时间短的对象. 上述两个观察事实统称为弱分代假设(Weak ...
关于Linux x64 Oracle JDK7u60 64-bit HotSpot VM 线程栈默认大小问题的整理
JVM线程的栈默认大小,oracle官网有简单描述: In Java SE 6, the default on Sparc is 512k in the 32-bit VM, and 1024k in ...
c语言指针与地址的区别
指针由两部分组成,指针的类型和指针的值(也就是变量的地址). 指针和地址的区别: 地址只是一堆十六进制的字符,对应着内存条的某段内存, 而指针本身有地址,指针的值也是一个地址,指针本身还有类型,这与单 ...

随机推荐

组合数学_第4章_Polya定理
第4章 Polya定理 4.1 群的概念 4.1.1 群的定义给定一个集合\(G=\{a,b,c,\cdots\}\)和集合\(G\)上的二元运算"\(\cdot\)",并满足下 ...
安装VMware Workstation 16 Pro
下载官网:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html 注:我是在新毒霸软件管 ...
2023-07-08：RabbitMQ如何做到消息不丢失？
2023-07-08:RabbitMQ如何做到消息不丢失? 答案2023-07-08: 1.持久化发送消息时设置delivery_mode属性为2,使消息被持久化保存到磁盘,即使RabbitMQ服务 ...
S32Kxxx bootloader之LIN bootloader
了解更多关于bootloader 的C语言实现,请加我Q扣: 1273623966 (验证信息请填 bootloader),欢迎咨询或定制bootloader(在线升级程序). 上一次发布博文到如今既 ...
详解nvim内建LSP体系与基于nvim-cmp的代码补全体系
2023年,nvim以及其生态已经发展的愈来愈完善了.nvim内置的LSP(以及具体的语言服务)加上众多插件,可以搭建出支持各种类型语法检查.代码补全.代码格式化等功能的IDE.网络上关于如何配置的文 ...
【xx-job】定时任务调度
XXL-JOB XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速.学习简单.轻量级.易扩展. 现已开放源代码并接入多家公司线上产品线,开箱即用. 一.任务调度中心 1.1 下载XXL- ...
行行AI人才直播第13期：刘红林律师《AIGC创业者4大法律问题需注意》
行行AI人才(海南行行智能科技有限公司)是博客园和顺顺智慧共同运营的AI行业人才全生命周期服务平台. AIGC爆火至今,商业落地已成为各行各业焦点的问题.它的广泛应用也带来了一系列的法律风险和挑战.一 ...
clickhouse 与 zookeeper
目录 clickhouse 设置中的 zookeeper 配置参数说明配置示例 [预发生产] ClickHouse Keeper 四字母命令 clickhouse 设置中的 zookeeper 配 ...
2021-3-9 excel导出
public void ExportExcel(DataTable dt) { //要添加epplus的nuget包 ExcelPackage.LicenseContext = LicenseCont ...
C++子类的构造函数
子类的构造函数子类可以有自己的构造函数子类没有构造函数,默认系统会调用父类的构造函数子类有自己的构造函数,系统会先运行父类的构造函数,随后运行子类的构造函数,对子类对象进行覆盖和拓展即不论子类 ...

C++指针和地址偏移在HotSpot VM中的应用

C++指针和地址偏移在HotSpot VM中的应用的更多相关文章

随机推荐

热门专题