使用C#编写.NET分析器-第二部分

译者注

这是在Datadog公司任职的Kevin Gosse大佬使用C#编写.NET分析器的系列文章之一，在国内只有很少很少的人了解和研究.NET分析器，它常被用于APM（应用性能诊断）、IDE、诊断工具中，比如Datadog的APM，Visual Studio的分析器以及Rider和Reshaper等等。之前只能使用C++编写，自从.NET NativeAOT发布以后，使用C#编写变为可能。

笔者最近也在尝试开发一个运行时方法注入的工具，欢迎熟悉MSIL 、PE Metadata 布局、CLR 源码、CLR Profiler API的大佬，或者对这个感兴趣的朋友留联系方式或者在公众号留言，一起交流学习。

原作者：Kevin Gosse

原文链接：https://minidump.net/writing-a-net-profiler-in-c-part-2-8039da001e43

项目链接：https://github.com/kevingosse/ManagedDotnetProfiler

使用C#编写.NET分析器-第一部分：https://mp.weixin.qq.com/s/faa9CFD2sEyGdiLMFJnyxw

正文

在第一部分中，我们看到了如何模仿COM对象的布局，并用它来暴露一个假的IClassFactory实例。它运行得很好，但是我们的解决方案使用了静态方法，所以在需要处理多个实例时跟踪对象状态不太方便。如果我们能将COM对象映射到.NET中的一个实际对象实例，那就太好了。

目前，我们的代码看起来是这样的：

public class DllMain

{

    private static ClassFactory Instance;  

    [UnmanagedCallersOnly(EntryPoint = "DllGetClassObject")]

    public static unsafe int DllGetClassObject(void* rclsid, void* riid, nint* ppv)

    {

        Console.WriteLine("Hello from the profiling API");  

        // 为虚方法表指针和指向5个方法的指针分配内存块

        var chunk = (IntPtr*)NativeMemory.Alloc(1 + 5, (nuint)IntPtr.Size);  

        // 虚方法表指针

        *chunk = (IntPtr)(chunk + 1);  

        // 指向接口的每个方法的指针

        *(chunk + 1) = (IntPtr)(delegate* unmanaged<IntPtr, Guid*, IntPtr*, int>)&QueryInterface;

        *(chunk + 2) = (IntPtr)(delegate* unmanaged<IntPtr, int>)&AddRef;

        *(chunk + 3) = (IntPtr)(delegate* unmanaged<IntPtr, int>)&Release;

        *(chunk + 4) = (IntPtr)(delegate* unmanaged<IntPtr, IntPtr, Guid*, IntPtr*, int>)&CreateInstance;

        *(chunk + 5) = (IntPtr)(delegate* unmanaged<IntPtr, bool, int>)&LockServer;  

        *ppv = (IntPtr)chunk;  

        return HResult.S_OK;

    }  

    [UnmanagedCallersOnly]

    public static unsafe int QueryInterface(IntPtr self, Guid* guid, IntPtr* ptr)

    {

        Console.WriteLine("QueryInterface");

        *ptr = IntPtr.Zero;

        return 0;

    }  

    [UnmanagedCallersOnly]

    public static int AddRef(IntPtr self)

    {

        Console.WriteLine("AddRef");

        return 1;

    }  

    [UnmanagedCallersOnly]

    public static int Release(IntPtr self)

    {

        Console.WriteLine("Release");

        return 1;

    }  

    [UnmanagedCallersOnly]

    public static unsafe int CreateInstance(IntPtr self, IntPtr outer, Guid* guid, IntPtr* instance)

    {

        Console.WriteLine("CreateInstance");

        *instance = IntPtr.Zero;

        return 0;

    }  

    [UnmanagedCallersOnly]

    public static int LockServer(IntPtr self, bool @lock)

    {

        return 0;

    }

}

理想情况下，我们希望有一个实际的对象，带有实例方法，如下所示：

public class ClassFactory

{

    public unsafe int QueryInterface(IntPtr self, Guid* guid, IntPtr* ptr)

    {

        Console.WriteLine("QueryInterface");

        *ptr = IntPtr.Zero;

        return 0;

    }

    public int AddRef(IntPtr self)

    {

        Console.WriteLine("AddRef");

        return 1;

    }

    public int Release(IntPtr self)

    {

        Console.WriteLine("Release");

        return 1;

    }

    public unsafe int CreateInstance(IntPtr self, IntPtr outer, Guid* guid, IntPtr* instance)

    {

        Console.WriteLine("CreateInstance");

        *instance = IntPtr.Zero;

        return 0;

    }

    public int LockServer(IntPtr self, bool @lock)

    {

        return 0;

    }

}

然而，原生端只能调用用UnmanagedCallersOnly属性修饰的方法，而这个属性只能应用于静态方法。因此，我们需要一组静态方法，以及从这些静态方法中检索对象实例的方法。

实现这一点的关键是这些方法的self参数。因为我们模仿C++对象的布局，本地对象实例的地址作为第一个参数传递。我们可以使用它来检索我们的托管对象并调用非静态版本的方法。例如：

public unsafe class ClassFactory

{

    private static Dictionary<IntPtr, ClassFactory> _instances = new(); 

    public ClassFactory()

    {

        // 为虚拟表指针和指向5个方法的指针分配内存块

        var chunk = (IntPtr*)NativeMemory.Alloc(1 + 5, (nuint)IntPtr.Size); 

        // 指向虚拟表的指针

        chunk = (IntPtr)(chunk + 1); 

        // 指向接口中每个方法的指针

        (chunk + 1) = (IntPtr)(delegate unmanaged<IntPtr, Guid, IntPtr*, int>)&QueryInterfaceNative; 

        // [...] (为简洁起见，已省略) 

        _instances.Add((IntPtr)chunk, this);

    } 

    public int QueryInterface(Guid* guid, IntPtr* ptr)

    {

        Console.WriteLine("QueryInterface");

        ptr = IntPtr.Zero;

        return 0;

    } 

    // [...] (对于ClassFactory的其他实例方法也是如此) 

    [UnmanagedCallersOnly]

    public static int QueryInterfaceNative(IntPtr self, Guid guid, IntPtr* ptr)

    {

        var instance = _instances[self]; 

        return instance.QueryInterface(guid, ptr);

    } 

    // [...] (对于ClassFactory的其他静态方法也是如此)

}

在构造函数中，我们将ClassFactory的实例添加到一个静态字典中，并关联到相应的本地对象的地址。在静态的QueryInterfaceNative方法中，我们从静态字典中检索该实例，并调用非静态的QueryInterface方法。

这是可行的，但每次调用方法时都要进行字典查找是很遗憾的。而且，我们需要处理并发（可能需要使用ConcurrentDictionary）。有没有更好的解决方案？

我们已经有了一个指向本地对象的指针，所以如果本地对象可以存储一个指向托管对象的指针就太好了。像这样：

public ClassFactory()

{

    // 为虚拟表指针+托管对象地址+指向5个方法的指针分配内存块

    var chunk = (IntPtr*)NativeMemory.Alloc(2 + 5, (nuint)IntPtr.Size); 

    // 指向虚拟表的指针

    *chunk = (IntPtr)(chunk + 2); 

    // 指向托管对象的指针

    *(chunk + 1) = &this; 

    // [...]

}

如果我们有了这个，那么从静态方法中只需获取指向托管对象的指针就可以了：

[UnmanagedCallersOnly]

public static unsafe int QueryInterfaceNative(IntPtr* self, Guid* guid, IntPtr* ptr)

{

    var instance = *(ClassFactory*)(self + 1); 

    return instance.QueryInterface(guid, ptr);

}

但是&this不能编译*，原因很充分：托管对象可能会在任何时候被垃圾回收器移动，所以指针在下一次垃圾回收时可能变得无效。

*: 我撒谎了。如果你使用的是最新版本的C#，那么你可以获取this的地址：

var classFactory = this;

(chunk + 1) = (nint)(nint)&classFactory;

但是由于上述原因，这是不安全的，所以除非你知道自己在做什么，否则请不要这样做。

你可能会想要将对象固定来解决这个问题，但是你不能将一个有对其他托管对象引用的对象固定，所以这也不好。

我们需要的是一种指向托管对象的固定引用，幸运的是，GCHandle正好提供了这样的功能。如果我们为一个托管对象分配一个GCHandle，我们可以使用GCHandle.ToIntPtr获取与该句柄关联的固定地址，并使用GCHandle.FromIntPtr从该地址检索句柄。因此，我们可以这样做：

public ClassFactory()

{

    // 为虚拟表指针、托管对象地址以及5个方法的指针分配内存块

    var chunk = (IntPtr*)NativeMemory.Alloc(2 + 5, (nuint)IntPtr.Size); 

    // 虚拟表指针

    *chunk = (IntPtr)(chunk + 2); 

    // 托管对象指针

    var handle = GCHandle.Alloc(this);

    *(chunk + 1) = GCHandle.ToIntPtr(handle); 

    // [...]

}

接着，我们可以从静态方法中检索句柄和关联对象：

[UnmanagedCallersOnly]

public static unsafe int QueryInterfaceNative(IntPtr\* self, Guid* guid, IntPtr* ptr)

{

    var handleAddress = *(self + 1);

    var handle = GCHandle.FromIntPtr(handleAddress);

    var instance = (ClassFactory)handle.Target; 

    return instance.QueryInterface(guid, ptr);

}

将所有内容整合在一起，我们的ClassFactory现在看起来像这样：

public unsafe class ClassFactory

{

    public ClassFactory()

    {

        // Allocate the chunk of memory for the vtable pointer + the address of the managed object + the pointers to the 5 methods

        var chunk = (IntPtr*)NativeMemory.Alloc(2 + 5, (nuint)IntPtr.Size);

        // Pointer to the vtable

        *chunk = (IntPtr)(chunk + 2);

        // Pointer to the managed object

        var handle = GCHandle.Alloc(this);

        *(chunk + 1) = GCHandle.ToIntPtr(handle);

        *(chunk + 2) = (IntPtr)(delegate* unmanaged<IntPtr*, Guid*, IntPtr*, int>)&Exports.QueryInterface;

        *(chunk + 3) = (IntPtr)(delegate* unmanaged<IntPtr*, int>)&Exports.AddRef;

        *(chunk + 4) = (IntPtr)(delegate* unmanaged<IntPtr*, int>)&Exports.Release;

        *(chunk + 5) = (IntPtr)(delegate* unmanaged<IntPtr*, IntPtr, Guid*, IntPtr*, int>)&Exports.CreateInstance;

        *(chunk + 6) = (IntPtr)(delegate* unmanaged<IntPtr*, bool, int>)&Exports.LockServer;

        Object = (IntPtr)chunk;

    }

    public IntPtr Object { get; }

    public int QueryInterface(Guid* guid, IntPtr* ptr)

    {

        Console.WriteLine("QueryInterface");

        *ptr = IntPtr.Zero;

        return 0;

    }

    public int AddRef()

    {

        Console.WriteLine("AddRef");

        return 1;

    }

    public int Release()

    {

        Console.WriteLine("Release");

        return 1;

    }

    public int CreateInstance(IntPtr outer, Guid* guid, IntPtr* instance)

    {

        Console.WriteLine("CreateInstance");

        *instance = IntPtr.Zero;

        return 0;

    }

    public int LockServer(bool @lock)

    {

        Console.WriteLine("LockServer");

        return 0;

    }

    private class Exports

    {

        [UnmanagedCallersOnly]

        public static int QueryInterface(IntPtr* self, Guid* guid, IntPtr* ptr)

        {

            var handleAddress = *(self + 1);

            var handle = GCHandle.FromIntPtr(handleAddress);

            var obj = (ClassFactory)handle.Target;

            return obj.QueryInterface(guid, ptr);

        }

        [UnmanagedCallersOnly]

        public static int AddRef(IntPtr* self)

        {

            var handleAddress = *(self + 1);

            var handle = GCHandle.FromIntPtr(handleAddress);

            var obj = (ClassFactory)handle.Target;

            return obj.AddRef();

        }

        [UnmanagedCallersOnly]

        public static int Release(IntPtr* self)

        {

            var handleAddress = *(self + 1);

            var handle = GCHandle.FromIntPtr(handleAddress);

            var obj = (ClassFactory)handle.Target;

            return obj.Release();

        }

        [UnmanagedCallersOnly]

        public static unsafe int CreateInstance(IntPtr* self, IntPtr outer, Guid* guid, IntPtr* instance)

        {

            var handleAddress = *(self + 1);

            var handle = GCHandle.FromIntPtr(handleAddress);

            var obj = (ClassFactory)handle.Target;

            return obj.CreateInstance(outer, guid, instance);

        }

        [UnmanagedCallersOnly]

        public static int LockServer(IntPtr* self, bool @lock)

        {

            var handleAddress = *(self + 1);

            var handle = GCHandle.FromIntPtr(handleAddress);

            var obj = (ClassFactory)handle.Target;

            return obj.LockServer(@lock);

        }

    }

}

（注意，我将静态方法移到了一个嵌套类中，以避免名称冲突）

我们可以从入口点使用它：

public class DllMain

{

    private static ClassFactory Instance; 

    [UnmanagedCallersOnly(EntryPoint = "DllGetClassObject")]

    public static unsafe int DllGetClassObject(void* rclsid, void* riid, nint* ppv)

    {

        Instance = new ClassFactory(); 

        Console.WriteLine("来自分析API的问候"); 

        *ppv = Instance.Object; 

        return HResult.S_OK;

    }

}

剩下的就是为ICorProfilerCallback及其约70个方法做这个。我们不打算手动完成这个任务，所以下一篇文章中我们将编写一个源代码生成器来自动化这个过程。

使用C#编写.NET分析器-第二部分的更多相关文章

python之编写购物车（第二天）
作业: 编写购物车具体实现了如下功能: 1.可购买的商品信息显示 2.显示购物车内的商品信息.数量.总金额 3.购物车内的商品数量进行增加.减少和商品的删除 4.用户余额的充值 5.用户购买完成进行 ...
如何使用VS Code编写Spring Boot (第二弹)
本篇文章是续<如何使用VS Code编写Spring Boot> 之后,结合自己.net经验捣鼓的小demo,一个简单的CRUD,对于习惯了VS操作模式的.net人员非常方便,强大的智能提 ...
使用C#编写一个.NET分析器（一）
译者注这是在Datadog公司任职的Kevin Gosse大佬使用C#编写.NET分析器的系列文章之一,在国内只有很少很少的人了解和研究.NET分析器,它常被用于APM(应用性能诊断).IDE.诊断 ...
用 C 语言编写一个简单的垃圾回收器
人们似乎觉得编写垃圾回收机制是非常难的,是一种仅仅有少数智者和Hans Boehm(et al)才干理解的高深魔法.我觉得编写垃圾回收最难的地方就是内存分配,这和阅读K&R所写的malloc例 ...
atitit.自己动手开发编译器and解释器(2) ------语法分析，语义分析，代码生成--attilax总结
atitit.自己动手开发编译器and解释器(2) ------语法分析,语义分析,代码生成--attilax总结 1. 建立AST 抽象语法树 Abstract Syntax Tree,AST) 1 ...
《[MySQL技术内幕：SQL编程》读书笔记
<[MySQL技术内幕:SQL编程>读书笔记 2019年3月31日23:12:11 严禁转载!!! <MySQL技术内幕:SQL编程>这本书是我比较喜欢的一位国内作者姜承尧, ...
F#周报2019年第28期
新闻 FableConf门票开始贩售 Bolero的HTML模板支持热加载 Bolero从v0.4到v0.5的升级指南完整的SAFE-Chat迁移至了Fable 2 为纯函数式3D图形生成领域专用语 ...
OO_Unit4_Summary暨课程总结
初始oo,有被往届传言给吓到:oo进行中,也的确有时会被作业困扰(debug到差点放弃):而oo即将结束的此刻,却又格外感慨这段oo历程. 一.单元架构设计本单元任务是设计一个UML解析器,能够支持 ...
团队开发——冲刺2.f
冲刺阶段二(第六天) 1.昨天做了什么? 编写软件测试计划书第二部分:游戏中新增3个道具(变大.变小.延时). 2.今天准备做什么? 1) 编写软件计划书第三阶段(项目任务.实施计划.风险管理): 2 ...
JS之模板技术（aui / artTemplate）
artTemplate是个好东西啊,一个开源的js前端模板引擎,使用简单,渲染效率特别的高. 我经常使用这个技术来在前端动态生成新闻列表,排行榜,历史记录等需要在前端列表显示的信息. 下面是artTe ...

随机推荐

Centos8发布，下载链接
就在昨天Centos8发布了,今天试着尝鲜,感受:真香. 瞧官网都没有介绍,真香就是了. Centos 8 下载地址:http://ftp.sjtu.edu.cn/centos/8.0.1905/is ...
mysql迁移：mysqldump导出表结构及数据
问题描述:有需要mysql某几张表的需求,某个数据库某几张表,导出先检查相应的数据库和表是否存在数据泵用法:默认导出的是表结构以及表中的数据 mysqldump -uroot -p -S /data ...
XXL-JOB定时任务框架(Oracle定制版)
特点 xxl-job是一个轻量级.易扩展的分布式任务调度平台,能够快速开发和简单学习.开放源代码并被多家公司线上产品使用,开箱即用.尽管其确实非常好用,但我在工作中使用的是Oracle数据库,因为xx ...
[OpenCV-Python] 7 把鼠标当画笔
文章目录 OpenCV-Python: II OpenCV 中的 Gui 特性 7 把鼠标当画笔 7.1 简单演示 7.2 高级一点的示例 OpenCV-Python: II OpenCV 中的 Gu ...
ADB-安装配置
一.只要下载ADB安装包即可就这4个文件: 备注:如果下载放入到D盘去解压,打开dos窗口那么就要进入到D盘,然后再去执行adb命令,输入adb查看它是否安装成功二.ADB命令简单使用查看连接设 ...
2020-10-09：假如我能拿到别人的URL,然后篡改数据（金额）发送给系统，如何避免这种事情的发生？
福哥答案2020-10-09:#福大大架构师每日一题# [此答案来自知乎:](https://www.zhihu.com/question/424764253) 这种敏感url一般都有安全机制的:1. ...
2020-01-16：我截获了登录token的话，是不是就获得了登录状态，这样就不安全了。如何保证安全？
福哥答案2020-01-06:[知乎答案:](https://www.zhihu.com/question/439602796)首先,Token 一般放在 Header 或者 Cookies 中,Ht ...
2022-05-11：k8s安装easydarwin流媒体服务器，yaml如何写？
2022-05-11:k8s安装easydarwin流媒体服务器,yaml如何写? 答案2022-05-11: yaml如下: apiVersion: apps/v1 kind: Deployment ...
2021-09-17：给你一个链表，删除链表的倒数第 n 个结点，并且返回链表的头结点。进阶：你能尝试使用一趟扫描实现吗？
2021-09-17:给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点.进阶:你能尝试使用一趟扫描实现吗? 福大大答案2021-09-17: 双指针. 1.创建虚拟头节点preHea ...
vue全家桶进阶之路32：Vue3 WatchEffect和watch 监听
在 Vue 3 中,watchEffect 是一个用于监听响应式数据变化的 API.它可以在函数内部自动跟踪数据的依赖,并在依赖变化时重新运行函数. watchEffect 的作用以及各个参数的功能讲 ...

使用C#编写.NET分析器-第二部分

译者注

正文

使用C#编写.NET分析器-第二部分的更多相关文章

随机推荐

热门专题