Go 原理之 gc 垃圾回收机制

一、常见垃圾回收算法

垃圾回收算法 描述 代表语言 优缺点
引用计数 为每个对象维护一个引用计数,记录对象被引用的次数
每当一个对象被引用时,引用计数就会增加。
当对象不再被引用时,引用计数就会减少。
如果对象的引用计数变为 0,
则对象可以被垃圾回收器回收
PythonPHP 优点
实现简单,处理快
缺点
无法处理循环引用,两个对象相互引用,计数永远不为0
分代收集 按照对象生命周期长短划分不同的代空间,
生命周期长的放入老年代,短的放入新生代,
不同代有不同的回收算法和回收频率
Java 优点
性能好
缺点
需要 STW,算法复杂
三色标记法 从根变量开始遍历所有引用的对象,标记引用的对象为不同颜色,
被标记为白色的对象进行回收
Golang 优点
解决了引用计数的缺点
缺点
需要 STW,暂时停掉程序运行

注意️:以上都需要 STW

二、Go 的 gc:三色标记 + 混合写屏障

(一)三色标记

v1.13之前,go 使用的是 标记-清除法,需要 stw ,效率极低;

v1.15之后,go 采用 三色标记 + 混合写屏障 极大的降低stw的时间,提高gc性能

三色标记白色(清除对象) + 灰色(过渡对象,受保护, 最终变黑色) + 黑色(受保护)

可达对象引用关系举例

可达的意思就是可以关联到的,有对象引用它了

对象1 = 对象2 // 对象2可达,对象1引用了对象2,对象2 被 对象1 引用
对象1 = 对象3
对象2 = 对象3
对象2 = 对象5

三色标记-流程

    1. 初始时,所有对象被标记为白色
    1. gc 开始,遍历 rootset 根节点,将有引用对象的对象标记为 灰色,存入灰色对象列表
    1. 遍历 灰色对象,将直接可达对象标记为 灰色,并将自身标记为 黑色
    1. 重复第3步,直到标记完所有的对象 (灰色对象列表为空)
    1. 将白色对象清除,保留黑色对象

(二)混合写屏障

三色标记存在并发问题:

在三色标记期间,如果没有STW,并发创建对象,可能存在 == 垃圾对象或误删对象 == 的情况:

    1. 黑色对象的引用对象被删除,则不可达,正常黑色对象应该被回收,但是gc期间只会循环遍历灰色列表,不会回收黑色对象,因此该对象为垃圾对象 (多余垃圾对象)

      eg:对象1已经被标记为黑色,表示该对象有引用方,受保护,如果没有stw,该对象的引用可能被删除,正常应该转为白色对象被清除,然gc并不会清除黑色对象

    1. 黑色对象引用了白色对象,白色对象有了引用对象应该被保护,但仍然被无情的回收 (清掉不该清的对象)

    ​ 白色对象只有被灰色对象引用情况,才会判断是否需要清理,白色对象如果在gc期间引用了黑色对象,那只会被误删除

所以 go 引入了 混合写屏障 机制,满足:

  • 强三色不变式:黑色对象不允许引用了白色对象;因为一旦引用,该黑色对象将不会继续参与 gc,白色对象会被无理清除
  • 弱三色不变式:黑色对象可以引用白色对象,但该白色对象必须被其它灰色对象或其上游有灰色对象引用,否则该白色对象将被无理清除

这里需要注意一点,插入屏障仅会在堆内存中生效,不对栈内存空间生效,这是因为 go 在并发运行时,大部分的操作都发生在栈上,函数调用会非常频繁。

数十万goroutine的栈都进行屏障保护自然会有性能问题

所以 gc 期间,任何在栈上新创建的对象,均为黑色。

混合写屏障 开启期间 描述
插入写屏障 创建的新对象为灰色对象 满足:强三色不变式。
不会存在黑色对象引用白色对象
删除写屏障 被删除的对象,如果自身为灰色或者白色,那么被标记为灰色 满足:弱三色不变式
(保护灰色对象到白色对象的路径不会断)

(三)优缺点

优点:

减少stw时间,三色标记需要stw整个程序,混合写屏障(分段stw)可以有效降低stw的时间

缺点:

回收精度低,有些垃圾需要在下一轮 gc 清理

(四)完整的 gc 流程

三色标记 + 混合写屏障

  • 标记准备(Mark Setup):开启混合写屏障(Write Barrier),需 STW(stop the world)
  • 标记开始(Marking):使用三色标记法并发标记 ,与用户程序并发执行
  • 标记终止(Mark Termination):对触发写屏障的对象进行重新扫描标记,关闭写屏障(Write Barrier),需 STW(stop the world)
  • 清理(Sweeping):将需要回收的内存归还到堆中,将过多的内存归还给操作系统,与用户程序并发执行

三、源码解析

/go/1.18.3/libexec/src/runtime/mgc.go

四、常见问题

1. gc 多久执行一次,什么时候触发

  • 定时触发:Go 运行时系统会根据一定的时间间隔定期触发垃圾回收。时间间隔根据程序的内存使用情况和性能需求进行自适应调整
  • 内存分配触发:当程序申请的内存超过一定阈值时,Go 运行时会触发垃圾回收,以防止过度使用内存
  • 栈伸缩触发:当 Goroutine 的栈空间不足以容纳当前的执行需要时,Go 运行时会触发垃圾回收来扩展栈空间
  • 主动触发:调用 runtime.GC
  • 空间不足时触发: 当前线程的内存管理单元中不存在空闲空间时,创建32KB以下的对象可能触发垃圾收集,创建32KB以上的对象时,一定会尝试触发

2. 为什么混合写屏障不保护栈的引用

因为go在并发运行时,大部分的操作都发生在栈上,函数调用会非常频繁。数十万goroutine的栈都进行屏障保护自然会有性能问题

虽然混合写屏障不保护栈上的引用,但 Go 语言的垃圾回收器在标记终止阶段会对栈进行重新扫描。在这个阶段,会暂停所有的用户程序(STW),对栈上的对象和引用进行精确的标记,确保所有可达对象都被正确标记。这样就弥补了不使用写屏障保护栈上引用的不足,保证了垃圾回收的正确性。

综上所述,混合写屏障不保护栈的引用是为了在保证垃圾回收正确性的前提下,尽可能提高程序的性能和降低实现复杂度。通过栈重新扫描机制,也能确保栈上的可达对象不会被错误回收。

3. gc 过程中那一部分使用了 STW

  • 标记准备阶段(Mark Setup)

    在这个阶段,垃圾回收器需要初始化标记状态,开启写屏障等操作。为了确保标记的正确性,需要暂停所有的用户程序,进行 STW

    在标记阶段开始前会进行一次STW,暂停所有goroutine的执行,然后再进行标记操作

  • 标记终止阶段(Mark Termination)

    在并发标记阶段结束后,可能还有一些标记工作没有完成,如一些新创建的对象或者修改的引用关系没有被标记。因此,需要暂停所有的用户程序,完成剩余的标记工作,关闭写屏障,统计所有需要回收的对象。

原文地址

Go 原理之 gc 垃圾回收机制:三色标记 + 混合写屏障(需要 STW)

Go 原理之 gc 垃圾回收机制:三色标记 + 混合写屏障(需要 STW)的更多相关文章

  1. 面试官,不要再问我“Java GC垃圾回收机制”了

    Java GC垃圾回收几乎是面试必问的JVM问题之一,本篇文章带领大家了解Java GC的底层原理,图文并茂,突破学习及面试瓶颈. 楔子-JVM内存结构补充 在上篇<JVM之内存结构详解> ...

  2. java面试题之----JVM架构和GC垃圾回收机制详解

    JVM架构和GC垃圾回收机制详解 jvm,jre,jdk三者之间的关系 JRE (Java Run Environment):JRE包含了java底层的类库,该类库是由c/c++编写实现的 JDK ( ...

  3. 乐字节Java|GC垃圾回收机制、package和import

    本文接上一篇:乐字节Java|this关键字.static关键字.block块.本文是接着讲述JavaGC垃圾回收机制.package 和 import语句. 一.GC垃圾回收机制 GC全名:Garb ...

  4. 通俗易懂.NET GC垃圾回收机制(适用于小白面试,大牛勿喷)

    情景:你接到xx公司面试邀请,你怀着激动忐忑的心坐在对方公司会议室,想着等会的技术面试.技术总监此时走来,与你简单交谈后.... 技术:你对GC垃圾回收机制了解的怎么样? 你:还行,有简单了解过. 技 ...

  5. 精华推荐 | 【JVM深层系列】「GC底层调优系列」一文带你彻底加强夯实底层原理之GC垃圾回收技术的分析指南(GC原理透析)

    前提介绍 很多小伙伴,都跟我反馈,说自己总是对JVM这一块的学习和认识不够扎实也不够成熟,因为JVM的一些特性以及运作机制总是混淆以及不确定,导致面试和工作实战中出现了很多的纰漏和短板,解决广大小伙伴 ...

  6. JVM和GC垃圾回收机制和内存分配

    JVM运行期间 线程共享 线程私有 线程共享: 方法区 堆方法区:存放可以共享数据,静态常量,类的共有方法属性字段等,可以共享的存在方法区. 堆:存放class对象 . 线程私有:本地方法栈 虚拟机栈 ...

  7. JVM架构和GC垃圾回收机制

    深入理解系列之JDK8下JVM虚拟机(1)——JVM内存组成 https://blog.csdn.net/u011552404/article/details/80306316 JVM架构和GC垃圾回 ...

  8. GC垃圾回收机制详解

    JVM堆相关知识    为什么先说JVM堆?  JVM的堆是Java对象的活动空间,程序中的类的对象从中分配空间,其存储着正在运行着的应用程序用到的所有对象.这些对象的建立方式就是那些new一类的操作 ...

  9. asp.net 之 GC (垃圾回收机制)

    今天抽时间好好整理了下GC相关知识,看了CSDN和博客园的几篇文章,有了一定的简单了解,决定根据个人理解整合一份随笔写下来,望诸位指教. 一:基础问题 1.首先需要知道了解什么是GC? GC如其名,就 ...

  10. Android内存优化3 了解java GC 垃圾回收机制1

    开篇废话 如果我们想要进行内存优化的工作,还是需要了解一下,但这一块的知识属于纯理论的,有可能看起来会有点枯燥,我尽量把这一篇的内容按照一定的逻辑来走一遍.首先,我们为什么要学习垃圾回收的机制,我大概 ...

随机推荐

  1. 【记录】OpenAI|Python调用GPT API的开发环境及代码(2024/03/21实测)

    本文默认读者已经有API Keys,并默认读者对Python环境较为熟悉,对相关内容不予介绍. 更新时间:2024/03/21 国内安装的时候偶尔会出现各种问题, 这篇记录是记录当下可用的一个方式. ...

  2. 106套Axure RP大数据可视化大屏模板及通用组件库

    106套Axure RP大数据可视化大屏模板包括了多种实用美观的可视化组件库及行业模板库,行业模板涵盖:金融.教育.医疗.政府.交通.制造等多个行业提供设计参考. 随着大数据的发展,可视化大屏在各行各 ...

  3. Excel工具类之“参数汇总”

    一.SXSSFWorkbook技术 1.冻结行数 代码 SXSSFWorkbook wb = new SXSSFWorkbook(); SXSSFSheet sheet = wb.createShee ...

  4. SQL 日常练习 (十四)

    最近的项目都比较忙, 没太有时间来做练习, 不过 sql 这块, 还是始终要保持良好的手感, 我已经渐渐感觉到, 随着写得越来越多, 当然不只是在这里, 更多是在工作中, 不过涉及信息安全不能共享. ...

  5. 汇编语言笔记——8086&&寻址方式与指令系统

    汇编语言中 语句不区分大小写,编译软件会自动识别语句 用户自定义的变量和符号必须区分大小写. 8086 1.寄存器 cpu在访问存储器时,必须指明: 段寄存器:所访问的存储单元属于哪个段 偏移量:相应 ...

  6. python3里面实现将日志文件写入当前脚本运行的文本中

    在 Python3 中,可以使用 logging 模块来实现将日志写入本地文本文件中.下面是一个简单的示例代码: import logging # 配置 logging 模块 logging.basi ...

  7. iStore实现 SmartDNS + AdGuard Home IP优选+广告屏蔽

    iStore实现 SmartDNS + AdGuard Home IP优选+广告屏蔽 参考自openwrt 官方版 安装配置 AdGuard Home + smartdns 告别广告烦扰 教程 软路由 ...

  8. 【Zookeeper】ZooKeeper集群搭建与选举原理终极指南(Docker版 + 三角色详解)

    ZooKeeper集群搭建与选举原理终极指南(Docker版 + 三角色详解) 一.环境准备(Docker版) 1. 服务器准备(3台节点) # 所有节点执行 sudo apt-get update ...

  9. Element-Plus官网Header类像素效果的实现

      Element-Plus官网Header类像素效果 一.前言 在使用Element-Plus时,发现有两个很有趣的效果,一个是header的背景模糊效果,另一个是黑夜模式切换动画,在此我们先来研究 ...

  10. DTMO直播预告丨ChunJun 2022年开源规划&支持异构数据源DDL转换与自动执行

    ​  DTMO DTMO(DTstack Meetup Online)是袋鼠云数栈技术团队2022年的全新开源项目技术分享活动,我们秉承着开源共享的理念,旨在为大家分享大家分享袋鼠云大数据开源项目家族 ...