为什么Java有GC调优而没听说过有CLR的GC调优?
前言
在很多的场合我都遇到过一些群友提这样的一些问题:
- 为什么Java有GC调优而CLR没有听说过有GC调优呢?
 - 到底是Java的JVM GC比较强还是C#使用的.NET CLR的GC比较强呢?
其实业内已经有几位大佬的高赞文章和大家分享一下,主要讨论JVM和CLR还有GC调优,今天就借用大佬的回答给大家分享一下。 
R大的回答
首先给大家介绍一下R大,R大网名叫RednaxelaFX,南京大学毕业巨佬,主攻高级编程语言虚拟机的设计与实现,对于C# .NET CLR有非常深入的研究和了解。先后加入阿里、Oracle、Azul System从事JVM虚拟机开发的工作(HotSpot JVM and Zing JVM)。现在在Databricks从事Spark开发工作。
R大社交主页
iteye博客:https://www.iteye.com/blog/user/rednaxelafx
知乎主页: https://www.zhihu.com/people/rednaxelafx
GitHub: https://github.com/rednaxelafx
R大回答相关问题摘抄
为什么听说过 JVM 调优,却没听说过 CLR 调优?
RednaxelaFX的回答 - 知乎 https://www.zhihu.com/question/52900051/answer/132583244
这里R大主要就CLR上几种调优方式和为什么CLR不需要xmx、xmn等参数给出了原因
因为题主您就是没听说过 >_<
假定题主说的是下面三个层面的调优的头两种情况:
- 对VM的配置参数调优(例如GC参数)
 - 对应用程序自身的代码调优
 - 对VM自身的实现调优
 
(2)的话无论什么语言什么环境都好,追求性能的人肯定都有在做。Java和.NET都有好用的profiler可以帮助这方面的调查和调优。
有时候参数调优还不够的地方,也只能自己改自己的应用代码来解决问题了。请看一个经典案例:
In managed code we trust, our recent battles with the .NET Garbage Collector
(3)的话,CLR还没开源的时候,也无从调起。倒是有不少人给Mono贡献改进性能的patch,也算是广义上“.NET”的VM实现层面调优吧。
在CoreCLR开源后,也有不少人给CoreCLR贡献各种patch呢,包括“调优”。
.NET码农们以前时不时会中招的一种地方是程序进入GC的耗时(time-to-GC),也就是从CLR说“我要开始做GC了”到“真正开始做GC”之间的耗时。这里主要开销来自请求所有应用线程暂停(SuspendEE),这些线程要多久才完成对该请求的响应。听说过这个过程中会发生“250ms的倍数的等待时间”不?请跳传送门:
Garbage Collection Thread Suspension Delay (250ms Multiples)
像这种问题就是不进到VM内部做修改的话无法解决的。
(1)的话,其实就算当年CLR还没开源的时候,CLR也是有调优参数可以配置的呢。
最经典的就是选择试用Workstation GC(WKS GC)或者Server GC(SVR GC)。见过<gcServer>参数不?
后来可以配置使用Concurrent GC、Background Workstation GC、Background Server GC等。
用户还可以在代码里通过 GCSettings.LatencyMode 属性来影响GC的行为。
看,调优参数列表之一:
Runtime Settings Schema
不过CLR跟HotSpot VM在配置上有一个显著的区别,就是CLR不需要用户指定一个“GC堆的最大大小”。这跟CLR的GC堆的基础设计思路有关系。
HotSpot VM的GC堆一定要使用连续的虚拟地址空间。VM在启动的时候会一口气reserve GC所需要的整个地址空间,然后再按需commit。-Xmx会参与到GC堆最大大小的计算中。
CLR的GC堆则是分段式的(segemented),GC堆所用的空间会一个个segment分配,用满了一个再去分配一个新的;segment不需要在连续的地址空间上。这样GC堆可以按需自动增长或者缩减,可以一直增长到耗尽虚拟地址空间或者达到配额。
CLR这种分段式GC堆的好处是,在Windows上,特别是32位Windows上,虚拟地址空间中用户程序可以用的部分是比较零碎的,想要用到尽就不能对“连续的地址空间”有太多要求,这种条件下CLR跑在Windows上就可以充分利用资源。
而且这样一来,用户就不用头疼实现想好要配置多大的堆给CLR用了。反正它需要用多少会自己去增长。这用户体验就比绞尽脑汁想个好-Xmx要爽。
这种做法的坏处…怎能没有坏处呢。坏处也有若干。其中一个就是在这样的堆上实现的分代式GC的write barrier效率会比HotSpot那种用连续地址空间的要差一些。而且segmented heap实现起来也稍微复杂一些。
CLR 相比 JVM有哪些先进之处?
CLR 相比 JVM有哪些先进之处? - RednaxelaFX的回答 - 知乎 https://www.zhihu.com/question/39400401/answer/81293750
这里R大主要介绍了下CLR和JVM的不同,和下面hez大佬的回答可以对应起来
虽然只写了一半但还是先发出来免得坑掉。后面边讨论边更新吧…
这个问题原文是:
CLR 相比 JVM有哪些先进之处?
留下备份。
首先这个问题按其原样无法回答,因为CLR与JVM不是可比较的对象。
CLR(Common Language Runtime)是CLI(Common Language Infrastructure)规范中的VES(Virtual Execution System)的一种具体实现,而“JVM”不指定实现的话只能说是一种抽象的规范。
适合比较的对象是:
- 规范层面:CLI vs JVM
 - 实现层面:CLR / Mono 等 vs HotSpot VM / J9 VM / JRockit VM 等
 
从规范层面看的话,CLI规范
当前最新的版本是2012年出的第6版。我没太跟进新的CLI规范所以不确定这个版本的CLI与哪个版本的.NET Framework里的CLR对应。
JVM规范
The Java Virtual Machine Specification
当前最新的版本则是2015年出的Java SE 8版。
在规范层面上,当前的CLI完胜当前的JVM。
《Virtual Machines: Versatile Platforms for Systems and Processes》
一书中有一章专门对比介绍了CLI与JVM的设计,值得一读。
JVM规范由Sun最初的JVM实现(后来称为Classic VM)抽象而来,然后几乎没有大的改动。后来的更新主要添加了Class文件对泛型信息的有限记录、注解(annotation)支持、字节码校验器的更新(split verifier / type checking verifier)、invokedynamic及MethodHandle支持、default method支持等。
最初的JVM规范虽然也提到它“可以支持多种语言”,但主要目的还是支持Java一种语言的执行,直到Java 7添加了JSR 292(invokedynamic与MethodHandle)后才有了专门为Java以外的语言设计的功能。
CLI由.NET最初的CLR实现抽象而来,然后与CLR一起逐渐进化。它出现的时间毕竟比JVM规范晚许多,而且一开始就以支持多种语言、多种范型的执行与互操作为设计目的,自然设计得更完善。对历史有兴趣的同学可以搜搜“Project 7”看。
Interviewer: I've heard that there was a project where Microsoft started to inte...
Don Syme: That's a small part of the sequence. The visional design of the .NET platform was very much expected to be a multi-language platform from the start. Right back in 1998, just in fact as our research group in programming languages started at Microsoft and I joined the team and then other 10 of us joined the team, we were approached by a guy called James Plamondon, who started the project called Project 7, which was about getting 7 academic and 7 industrial programming languages on each side to target the .NET common language runtime and really check out if it was good enough, to see if design changes could be made early on in the design process of .NET to make sure it was good enough for a range of programming languages.
Project 7的参与方尝试了将许多种语言移植到CLR上,包括C、Pascal、Cobol (Fujitsu)、Fortran (Salford)、Haskell、Standard ML、Eiffel、Active Oberon for .NET (ETH)、Gardens Point Component Pascal (QUT)等等。
后来还有更进一步的“Project 7+”。
Technical Overview of the Common Language Runtime
要追寻CLR更早的黑历史就不得不提微软的Visual J++。请跳传送门:
微软当年的 J++ 究竟是什么?为什么 Sun 要告它? - RednaxelaFX 的回答
下面先列举一些点提醒我回头更新…
Assembly vs Class文件
- 常量池以stream的方式存在
 - 可以有strong name
 
CIL(Common Intermediate Language) / MSIL vs Java字节码
- CIL不仅有二进制形式的规范,而且还有标准的文本形式语法;Java字节码只有二进制形式的规范
 - 局部变量区里无论什么类型的值都使用1个slot,而JVM则是long和double用相邻的2个slot
 - 异常处理支持filter
 - 支持具现化泛型(reified generics)
 - 泛型支持声明点协变/逆变(declaration-site variance)
- Java语言层面的泛型则是支持使用点协变/逆变(use-site variance)
 
 - 支持无符号整数类型(unsigned)
 - 支持用户自定义值类型(value type)
 - 支持对用户自定义值类型指定显式内存布局,可以模拟C的struct和union以便互操作(StructLayout)
 - 支持检查溢出的算术运算(checked arithmetic)
 - 支持有保证的尾调用(tail call)
 - 支持unsafe verifiable代码
 - 支持轻量代码生成(LCG,Lightweight Code Generation)
 - 支持委托类型(Delegate / MulticastDelegate)
 - CLI Delegate的single cast版本与Java 7的MethodHandle有相似之处
 - 支持方便的P/Invoke和Reverse P/Invoke
 - 不支持自定义类加载器(custom class loader)。JVM上过于灵活的ClassLoader简直是头疼的要命,不支持这个简直好。
 
CLI里藏的私货:Assembly采用PE(Portable Executable)格式。PE是Windows上原生的可执行文件格式。
CLR与Windows的整合
- Windows Loader可以直接识别.NET Assembly并启动CLR来执行程序。
 - Windows对GAC(Global Assembly Cache)有文件系统层面的特殊处理,“Fusion”。
 - 与COM有良好的互操作能力。毕竟CLR原本就是希望设计成下一代COM,原本还用过COR这个名字(COM Object Runtime)。
 - 分块式GC堆(Chunked GC Heap),可以自动扩张和收缩GC堆的大小,并且在Windows这种地址空间比较破碎的环境中可以有效的利用地址空间里的空隙。对应的,JRockit在Windows上则是用filler object来利用空隙。
 - GC堆分为多个空间,特别是高频堆/低频堆(high-frequency heap / low-frequency heap)的划分很有趣。
 - GC支持固定住对象(Object Pinning)
 - GC提供API让应用程序可以指定native对象的内存压力,以便GC与native协调工作(System.GC.AddMemoryPressure Method (Int64))
 - 支持Windows的结构化异常处理(SEH)。
 
CLR 与 一些JVM实现之间有对应物的
- CLR:DAC / SOS扩展;HotSpot VM:Serviceability Agent;J9 VM:DTFJ / jdmpview
 - CLR:CAS(Code Access Security)与 JVM的沙箱
 
hez大佬的回答
再来给大家介绍一下hez2010大佬,今年刚从中山大学毕业,对于C++、.NET、C#、Rust等平台语言都有深入的研究,经常在博客园看文章的小伙伴应该早就看过hez佬的博文。他是.NET Runtime开源项目的持续贡献者、Microsoft Student Partner、可以说年少有为。
hez大佬的社交主页
个人博客:https://hez2010.com/
博客园:https://www.cnblogs.com/hez2010/
知乎:https://www.zhihu.com/people/hez2010
GitHub:https://github.com/hez2010
hez大佬回答相关问题摘抄
.NET Core已经开源好几年了, 为什么不像JVM那样很多人研究和调优其GC算法?
hez2010的回答 - 知乎 https://www.zhihu.com/question/365482363/answer/2389471084
这和虚拟机(这里指 JVM 和 CoreCLR)本身的特性有关系,由于基础设施的不同造成开发人员解决问题的取向不同。
当开发者遇到 GC 导致的问题时:
Java 开发者选择调优 GC,例如设置堆大小、调整各代和 region 的预算等等,最终使得“满足 GC 触发的条件”变得不那么容易满足来缓解这个问题,代价自然是内存占用更高,毕竟只要内存是无限的那就不需要 GC,同理只要 GC 对堆大小容忍度够高不去回收或者少回收,自然就能减轻 GC 带来的问题。因此开发者需要根据自身的 workload 来调配这些参数,最终达到一个既不会占用大的离谱甚至导致 OOM 错误,又不会导致频繁 GC 的平衡点。
而 .NET 开发者则会选择优化自己的代码,既然热路径中对象在托管堆内存上大量分配造成了频繁的 GC 导致出了性能问题,那干脆不用 class,转而去用 struct、stackalloc、fixed buffer、NativeMemory、Span 甚至指针,小对象什么的全都在栈上分配,用完自动随着栈的销毁而销毁,甚至 JIT 可以直接把小值类型对象优化到寄存器里面,连内存分配都不需要;堆内存也不需要 GC 托管堆了,直接用 NativeMemory 自己分配自己回收管理,全程完全不需要 GC 介入。这么做的指导思想很简单,既然是 GC 导致的问题,那么直接从源头解决:不分配托管堆内存就不需要 GC。
由于 CoreCLR 从一开始就是支持值类型、指针和非托管堆的,因此有能力的开发者可以在需要低延时的场景中(例如游戏)选择局部自行管理内存从而无需 GC;而其他大多数情况下 GC 并不会导致问题,因此这些时候开发者也可以充分利用 GC 带来的便利提升开发效率。
而 JVM 并没有这样的设施,因此开发者需要将解决问题的方法聚焦到如何让 GC 适应自己的 workload 上,通过调优一系列的参数来缓解因为 GC 导致的问题,再有就是通过 JVM 团队改进 GC 的算法来尽可能让 GC 暂停线程的时间变短。
另外,这也使得 JVM 和 CoreCLR 的工作重心完全不同,在 CoreCLR 上一个软实时 GC(ZGC)的重要性远远没有 JVM 上来的高,因此优先级就会变低。在 JVM 上 ZGC 是理所当然的重要,而在 CoreCLR 上却并不是,相反,.NET 工作重心则聚焦在改进 struct 相关的底层代码编写体验上:例如允许栈对象(ref struct)持有其他栈对象的引用(ref field),允许 ref struct 作泛型参数和约束,允许在栈上分配任何对象,以及栈对象生命周期的管理等等。
不过最近 CoreCLR 的 GC 团队也逐渐开始有兴趣实现软实时 GC 以改进游戏等低延时场景的开发体验(注意我说的是开发体验,因为让 GC 全盘管理堆内存可以很大程度上提升开发效率并避免内存安全问题,只是单纯要求低延时甚至 0 延时的话现在完全可以通过绕开 GC 做到),这也是建立在其他高优先级工作(例如 region 改造和 DPAD 等)基本都完成的基础上才轮到的。
至于某些极端情况,例如要求可预测的性能、绝对 0 GC 延时的,唯一办法只有绕开 GC,这种情况即使 ZGC 也无法对应。
更新:
补充一下,.NET 的 GC 是可以直接替换实现的,通过设置环境变量 DOTNET_GCName 指向你按照接口自己实现的 GC 的路径,就能做到替换掉自带的 GC:
所以要是真的对自带 GC 不满的话,可以考虑自己写 GC 来用。
总结
两位大佬回答的比较好,基本原因给说的比较明白了,在我看来两者的比较如下:
- 从大多数人所认为“调优”选项来说,其实.NET CLR GC也是有调优选项的,只是因为CLR的GC默认使用了Segment方式来组织内存,会动态的申请和归还内存空间,所以不需要像JVM一些GC一样去人为的设置
-xmx、-xmn、-xms这些选项。 - 现在的.NET的GC和JVM上的GC(指G1)其实是平分秋色,因为都是为高吞吐量设计的分代并行GC,在高吞吐量下都有着不错的表现,当然各自也有优化空间。
 - 受制于JVM平台没有自定义值类型、stackalloc、NativeMemory、Span和指针等特性,.NET这边能无分配或者栈上分配地方JVM上需要堆分配。所以JVM平台上的GC压力会比CLR上的压力更大一些(虽然有逃逸分析、标量替换等等JIT辅助技术,但是没有原生那么快)。
 - JVM平台开源的比较早,所以它的GC有非常多的选择,虽然造成初学者面临很多调优和选择的问题,但是GC的丰富性这一点是.NET平台上所缺失的。
 - JVM平台上有单独低延时的C4和ZGC。目前.NET平台上没有单独低延时GC实现,.NET平台这边低延时第一是调整GCMode为GCLatencyMode.SustainedLowLatency,另外通过值类型、ref、栈上分配、非托管操作还有在关键路径暂时关闭GC等方式来实现低延时。
 
GC算法从提出到现在历经了几十年的时间,笔者也关注了一些近年的论文,其实总得来说在冯诺依曼架构体系下,GC垃圾回收算法已经没有颠覆性的变化。
在这个算力没有指数级增长的时代,各个语言的GC算法都开始趋同(C# Java Js Go等等),在没有更创新性的GC算法出来之前,从源头上避免分配和Rust语言那样的RAII管理内存可能是各个语言后面都会走的路。
如果大家想了解更多GC相关的知识,可以看下方的文章链接和推荐的书。
https://www.cnblogs.com/InCerry/p/dotnet-gc-workflow-1.html
https://www.cnblogs.com/InCerry/p/maoni-mem-doc.html
https://www.cnblogs.com/InCerry/p/put-a-dpad-on-that-gc.html


为什么Java有GC调优而没听说过有CLR的GC调优?的更多相关文章
- 【高频Java面试题】简单说说JVM堆的内存结构和GC回收流程
		
目录 前言 JVM堆内存结构简述 JVM堆内存结构图 堆初体验 结构详情 新生代 老年代 永久代/元空间 GC回收流程 GC回收流程图 GC回收详细流程 查看JDK自带可视化堆空间图 总结 前言 我们 ...
 - [Spark性能调优] 第一章:性能调优的本质、Spark资源使用原理和调优要点分析
		
本課主題 大数据性能调优的本质 Spark 性能调优要点分析 Spark 资源使用原理流程 Spark 资源调优最佳实战 Spark 更高性能的算子 引言 我们谈大数据性能调优,到底在谈什么,它的本质 ...
 - spark 性能调优(一)  性能调优的本质、spark资源使用原理、调优要点分析
		
转载:http://www.cnblogs.com/jcchoiling/p/6440709.html 一.大数据性能调优的本质 编程的时候发现一个惊人的规律,软件是不存在的!所有编程高手级别的人无论 ...
 - 没听说过这些,就不要说你懂并发了,two。
		
引言 为了更加形象的描述并发的基础知识,因此本文LZ采用了园子里一度大火的标题形式——“没听说过XXXX,就不要说你XXXX了”.希望能够给猿友们一个醒目的警醒,借此来普及并发的基础知识,也讨论一下这 ...
 - CLR的GC工作模式介绍(Workstation和Server)
		
CLR的核心功能之一就是垃圾回收(garbage collection),关于GC的基本概念本文不在赘述.这里主要针对GC的两种工作模式展开讨论和研究. Workstaction模式介绍 该模式设计的 ...
 - 浅析CLR的GC(垃圾回收器)
		
文章目录: 了解托管堆和GC GC高效的处理方式—代 特殊类型的清理 手动监控和控制对象生命周期 1.了解托管堆和GC 在面向对象环境中,每一个类型都代表了一种资源.我们要使用这些资源,就要为这些代表 ...
 - PAT 甲级 1145 Hashing - Average Search Time (25 分)(读不懂题,也没听说过平方探测法解决哈希冲突。。。感觉题目也有点问题)
		
1145 Hashing - Average Search Time (25 分) The task of this problem is simple: insert a sequence of ...
 - 一文了解.Net的CLR、GC内存管理
		
一文了解.Net的CLR.GC内存管理 微软官方文档对内存管理和CLR的概述 什么是托管代码? 托管代码就是执行过程交由运行时管理的代码. 在这种情况下,相关的运行时称为公共语言运行时 (CLR),不 ...
 - JVM性能调优(3) —— 内存分配和垃圾回收调优
		
前序文章: JVM性能调优(1) -- JVM内存模型和类加载运行机制 JVM性能调优(2) -- 垃圾回收器和回收策略 一.内存调优的目标 新生代的垃圾回收是比较简单的,Eden区满了无法分配新对象 ...
 
随机推荐
- .NET混合开发解决方案7 WinForm程序中通过NuGet管理器引用集成WebView2控件
			
系列目录 [已更新最新开发文章,点击查看详细] WebView2组件支持在WinForm.WPF.WinUI3.Win32应用程序中集成加载Web网页功能应用.本篇主要介绍如何在WinForm ...
 - python写一个能变身电光耗子的贪吃蛇
			
python写一个不同的贪吃蛇 写这篇文章是因为最近课太多,没有精力去挖洞,记录一下学习中的收获,python那么好玩就写一个大一没有完成的贪吃蛇(主要还是跟课程有关o(╥﹏╥)o,课太多好烦) 第一 ...
 - TS 自学笔记(一)
			
TS 自学笔记(一) 本文写于 2020 年 5 月 6 日 日常废话两句 有几天没有更新了,最近学的比较乱,休息了两天感觉好一些了.这两天玩了几个设计软件,过几天也写篇文章分享分享. 为啥要学 TS ...
 - typescript 的安装和检测是否安装成功
			
全局安装typescript npm install -g typescript 检查typescript是否安装成功 tsc -v
 - yolov1学习笔记
			
yolov1学习笔记 yolov1将目标检测归为一个回归问题,具有real-time的特点.局限性是:对于群体性的小目标检测效果很差. 论文概括 本文重新构造目标检测作为一个回归问题. 直接输入图像到 ...
 - Fast-Rcnn学习笔记
			
Fast-Rcnn学习笔记 paper code Fast-RCNN总览 step1:图片先放进卷积层 step2:再卷积层的特征图谱上回映射出对应的感兴趣区域 step3:集过一层ROI Pooli ...
 - 拭目以待!JNPF .NET将更新.NET 6技术,同时上线 3.4.1 版本
			
2022年5月30日,福建引迈即将上线JNPF开发平台的.NET 6版本,在产品性能上做了深度优化,且极大的提升了工作效率,加强了对云服务的改进升级,全面提升用户的使用体验. JNPF是一个以PaaS ...
 - Web自动化定位方法以及常用便捷操作
			
很遗憾现在才开始给大家逐步分享自动化教程,原本计划着将现有的接口以及app.pc网页端进行自动化处理后再逐步给大家好好分享一下,由于当前实在没必要自动化操作了,所以临时用脑海中的知识再为大家继续更一篇 ...
 - Java绘图基础
			
<零基础学Java> Java绘图基础 绘图是高级程序设计中非常重要的技术,例如,应用程序需要绘制闪屏图像.背景图像.组件外观Web程序可以绘制统计图.数据库存储的图像资源等. Graph ...
 - DevStream 成为 CNCF Sandbox 项目啦!- 锣鼓喧天、鞭炮齐鸣、红旗招展、忘词了。
			
开局两张图,内容全靠"编" 来,有图有真相! DevStream ️ CNCF DevStream joins CNCF Sandbox CNCF Cloud Native Int ...