.Net CLR R2R编译的原理简析

前言

躺平了好一段时间了，都懒得动了。本文均为个人理解所述，如有疏漏，请指正。

楔子

金庸武侠天龙八部里面，少林寺至高无上的镇寺之宝，武林人士梦寐以求的内功秘笈易筋经被阿朱偷了，但是少林寺也没有大张旗鼓的派出高手去寻找，为啥？

这种少林寺至高无上的内功秘笈，一般的江湖人士根本看不懂。除非内功深厚的高手。

来看看.Net里面看不懂的内功秘笈R2R原理。

概念：

R2R编译实质上就是把方法运行的结果存储在二进制的动态链接库里面，在调用这个方法的时候，直接从动态链接库里面获取到方法的结果。而不需要经过RyuJit繁琐的编译，提升程序的性能。是一种AOT的预编译形式。

编译

dotnet publish -c Release -r win-x64 -p:PublishReadyToRun=true

整体过程：

当CLI命令里面标记了PublishReadyToRun，Rosyln重新编译生成的动态链接里面会生成Native Header，里面保存了当前模块的方法的运行结果。此后在CLR加载它的时候，CLR会查找动态链接库里的Native Header是否存在，如果存在，则在调用方的时候，直接获取到此方法的结果。

由于过程过于复杂此处只是提纲：

CLI(PublishReadyToRun：true)->Rosyln（Native Header） -> CLR (Get NH)

预编译存储结构

typedef struct _IMAGE_RUNTIME_FUNCTION_ENTRY {

    DWORD BeginAddress;

    DWORD EndAddress;

    union {

        DWORD UnwindInfoAddress;

        DWORD UnwindData;

    } DUMMYUNIONNAME;

} _IMAGE_RUNTIME_FUNCTION_ENTRY, *_PIMAGE_RUNTIME_FUNCTION_ENTRY;

构成方式：

动态链接库里面会分配一段内存空间，称之为Nativie Header。里面存储了包括如下内容：

1.编译器标识符（CompilerIdentifier）

2.导入方法段（ImportSections）

3.运行时方法（RuntimeFunctions）

4.方法入口点（MethodDefEntryPoints）

5.异常信息（ExceptionInfo）

6.调试信息（DebugInfo）

7.延迟方法加载调用快（DelayLoadMethodCallThunks）

等等总共高达18项信息，由于这些东西过于复杂此处只列出其中的前面几个。构成了Native Header。

加载R2R

CLR在进行一个模块加载的时候，它会初始化R2R，如果判断此模块有Native Header，那么把里面的18项信息加入到内存当中。代码如下(过于复杂，省略了大部分）

PTR_ReadyToRunInfo ReadyToRunInfo::Initialize(Module * pModule, AllocMemTracker *pamTracker)

{

    // 此处省略一百万行代码

    return new (pMemory) ReadyToRunInfo(pModule, pModule->GetLoaderAllocator(), pLayout, pHeader, nativeImage, pamTracker);

}

ReadyToRunInfo::ReadyToRunInfo(Module * pModule, LoaderAllocator* pLoaderAllocator, PEImageLayout * pLayout, READYTORUN_HEADER * pHeader, NativeImage *pNativeImage, AllocMemTracker *pamTracker)

    : m_pModule(pModule),

    m_pHeader(pHeader),

    m_pNativeImage(pNativeImage),

    m_readyToRunCodeDisabled(FALSE),

    m_Crst(CrstReadyToRunEntryPointToMethodDescMap),

    m_pPersistentInlineTrackingMap(NULL)

{

    // pHeader就是动态链接库里面的native header,它包含了Signature，MajorVersion，CoreHeader等。

    STANDARD_VM_CONTRACT;

    if (pNativeImage != NULL)

    {

        // 此处省略

    }

    else

    {

        m_pCompositeInfo = this;

        m_component = ReadyToRunCoreInfo(pLayout, &pHeader->CoreHeader);

        m_pComposite = &m_component;

        m_isComponentAssembly = false;

    }

    //获取运行时R2R方法的内存虚拟地址和所占的长度，后面用获取到的索引得到R2R方法的入口地址

    IMAGE_DATA_DIRECTORY * pRuntimeFunctionsDir = m_pComposite->FindSection(ReadyToRunSectionType::RuntimeFunctions);

    if (pRuntimeFunctionsDir != NULL)

    {

        m_pRuntimeFunctions = (T_RUNTIME_FUNCTION *)m_pComposite->GetLayout()->GetDirectoryData(pRuntimeFunctionsDir);

        m_nRuntimeFunctions = pRuntimeFunctionsDir->Size / sizeof(T_RUNTIME_FUNCTION);

    }

    else

    {

        m_nRuntimeFunctions = 0;

    }

调用过程：

当你在C#代码里面调用方法的时候，CLR检测当前方法所在的模块是否包含R2R信息，如果包含则获取到R2R信息，通过R2R信息，获取到Native Header里面的RuntimeFunctions和MethodDefEntryPoints。然后通过这两项计算出这个方法在RuntimeFunctions内存块里面的索引，通过这个索引计算出方法在RuntimeFunctions内存块的偏移值，通过偏移值获取属性BeginAddress，也就是方法在二进制动态链接库里面存储的结果。过程比较复杂，下面贴出部分代码。

PCODE MethodDesc::GetPrecompiledR2RCode(PrepareCodeConfig* pConfig)

{

    STANDARD_VM_CONTRACT;

    PCODE pCode = NULL;

#ifdef FEATURE_READYTORUN

    Module * pModule = GetModule(); //获取被调用的方法所在模块

    if (pModule->IsReadyToRun()) //检测此模块思否包含R2R信息

    {

	    //如果包含，则获取到R2R信息，然后获取被调用方法的入口点

        pCode = pModule->GetReadyToRunInfo()->GetEntryPoint(this, pConfig, TRUE /* fFixups */);

    }

}

//获取被调用方法入口点

PCODE ReadyToRunInfo::GetEntryPoint(MethodDesc * pMD, PrepareCodeConfig* pConfig, BOOL fFixups)

{

    mdToken token = pMD->GetMemberDef();

    int rid = RidFromToken(token);//获取被调用方法的MethodDef索引

    if (rid == 0)

        goto done;

    uint offset;

    if (pMD->HasClassOrMethodInstantiation())

    {

	   //此处省略一万字

    }

    else

    {

	    // 这个m_methodDefEntryPoints就是Native Header里面的方法入口点项。通过函数入口点项获取到被调用方法所在运行时方法（RuntimeFunctions）的索引

        if (!m_methodDefEntryPoints.TryGetAt(rid - 1, &offset))

            goto done;

    }

    uint id;

    offset = m_nativeReader.DecodeUnsigned(offset, &id);

    if (id & 1)

    {

        if (id & 2)

        {

            uint val;

            m_nativeReader.DecodeUnsigned(offset, &val);

            offset -= val;

        }

        if (fFixups)

        {

            BOOL mayUsePrecompiledNDirectMethods = TRUE;

            mayUsePrecompiledNDirectMethods = !pConfig->IsForMulticoreJit();

            if (!m_pModule->FixupDelayList(dac_cast<TADDR>(GetImage()->GetBase()) + offset, mayUsePrecompiledNDirectMethods))

            {

                pConfig->SetReadyToRunRejectedPrecompiledCode();

                goto done;

            }

        }

        id >>= 2;

    }

    else

    {

        id >>= 1;

    }

    _ASSERTE(id < m_nRuntimeFunctions);

	//上面经过了一系列的计算，把这个真正的索引id作为m_pRuntimeFunctions也就是native header项RuntimeFunctions的内存块的索引，然后获取到属性BeginAddress，也就是被调用方法的入口点。

    pEntryPoint = dac_cast<TADDR>(GetImage()->GetBase()) + m_pRuntimeFunctions[id].BeginAddress;

	这个地方是更新了下被调用方法的入口点

    m_pCompositeInfo->SetMethodDescForEntryPointInNativeImage(pEntryPoint, pMD);

    return pEntryPoint;

}

以上参考如下：

1.https://github.com/dotnet/runtime/blob/main/src/coreclr/gc/gchandletable.cpp

2.https://github.com/dotnet/runtime/blob/main/src/coreclr/gc/gc.cpp

3.https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/readytoruninfo.cpp

4.https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/prestub.cpp

5.https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/nativeformatreader.h

结尾：

一直认为技术是可以无限制的免费分享和随意攫取，如果你喜欢可以随意转载修改。微信公众号：jianghupt QQ群:676817308。欢迎大家一起讨论。

.Net CLR R2R编译的原理简析的更多相关文章

PHP的错误报错级别设置原理简析
原理简析摘录php.ini文件的默认配置(php5.4): ; Common Values: ; E_ALL (Show all errors, warnings and notices inclu ...
Java Annotation 及几个常用开源项目注解原理简析
PDF 版: Java Annotation.pdf, PPT 版:Java Annotation.pptx, Keynote 版:Java Annotation.key 一.Annotation 示 ...
Java Android 注解(Annotation) 及几个常用开源项目注解原理简析
不少开源库(ButterKnife.Retrofit.ActiveAndroid等等)都用到了注解的方式来简化代码提高开发效率. 本文简单介绍下 Annotation 示例.概念及作用.分类.自定义. ...
[转载] Thrift原理简析(JAVA)
转载自http://shift-alt-ctrl.iteye.com/blog/1987416 Apache Thrift是一个跨语言的服务框架,本质上为RPC,同时具有序列化.发序列化机制:当我们开 ...
Spring系列.@EnableRedisHttpSession原理简析
在集群系统中,经常会需要将Session进行共享.不然会出现这样一个问题:用户在系统A上登陆以后,假如后续的一些操作被负载均衡到系统B上面,系统B发现本机上没有这个用户的Session,会强制让用户重 ...
SIFT特征原理简析（HELU版)
SIFT(Scale-Invariant Feature Transform)是一种具有尺度不变性和光照不变性的特征描述子,也同时是一套特征提取的理论,首次由D. G. Lowe于2004年以< ...
基于IdentityServer4的OIDC实现单点登录(SSO)原理简析
写着前面 IdentityServer4的学习断断续续,兜兜转转,走了不少弯路,也花了不少时间.可能是因为没有阅读源码,也没有特别系统的学习资料,相关文章很多园子里的大佬都有涉及,有系列文章,比如: ...
动态代理原理简析（java. 动态编译，动态代理）
动态代理: 1.动态编译 JavaCompiler.CompilationTask 动态编译想理解自己查API文档 2.反射被代理类主要使用Method.invoke(Object o,Object ...
【超精简JS模版库/前端模板库】原理简析和 XSS防范
使用jsp.php.asp或者后来的struts等等的朋友,不一定知道什么是模版,但一定很清楚这样的开发方式: <div class="m-carousel"> < ...

随机推荐

Docker系列教程04-Docker构建镜像的三种方式
简介创建镜像的方法主要有三种:基于已有镜像的容器创建.基于本地模板导入.基于Dockerfile创建. 今天就逐一讲述为大家讲述,如何构建属于自己的docker镜像. 1.基于容器构建镜像基于已有 ...
PCIe引脚PRSNT与热插拔
热插拔的基本目的是要让PCIe设备按照规定的顺序.原则,从系统中移除或插入到系统中来,并能正常的工作,且不影响系统的正常运行.事实上,PCIe"热插拔"的关键目的就是为前面面所提到 ...
渗透：dSploit
dSploit--开源的专业的Android平台安全管理工具包只能在横屏模式下工作,即使你旋转你的设备也将继续保持横屏,如果你有一个应用程序,如旋转控制器,迫使每一个应用程序旋转,将导致dSploi ...
Spring Boot配置全局异常捕获
1 SpringBoot配置全局的异常捕获项目的说明配置thymeleaf作为视图模板 ExceptionController.java模拟测试用 MyAjaxExceptionHandler.j ...
Spring Ioc源码分析系列--容器实例化Bean的四种方法
Spring Ioc源码分析系列--实例化Bean的几种方法前言前面的文章Spring Ioc源码分析系列--Bean实例化过程(二)在讲解到bean真正通过那些方式实例化出来的时候,并没有继续分 ...
数据库常用DDL语句
一.创建表 CREATE TABLE TABLE_NAME( #create table 表名 ID INT(4) PRIMARY KEY, #字段名数据类型完整性约束条件 NAME VARCHA ...
Eureka属性配置
一:Eureka Instance实例信息配置里面的配置以"-"隔开其实也支持驼峰命名代替"-" 首先是入门时的配置: server: port: 80 ...
001 手把手用Git，Git从入门到上传本地项目到Github，看这篇就够了
安装git 下载Git 下载好后,一路next即可安装好后,打开Git bash,进行配置首先配置自己的身份 git config --global user.name "Name&qu ...
PHP时间轴函数
PHP时间轴函数可以更好的去进行用户体验.让用户动态的知道最近是什么时候,而不是死板的datatime去转换成固定的时间. 后续版本会考虑添加这个功能,代码先贴出来. function tranTim ...
这就是艺术「GitHub 热点速览 v.22.25」
作者:HelloGitHub-小鱼干不知道写了那么久代码的你,是否还记得"代码写诗"这个词,它是用来形容代码的优雅.但是本周的项目,虽然你看到的是代码的成品,也会惊讶于它的艺术感 ...

.Net CLR R2R编译的原理简析

.Net CLR R2R编译的原理简析的更多相关文章

随机推荐

热门专题