go的gc机制

go的gc机制

go 的 gc 机制

参考资料

详细总结: Golang GC、三色标记、混合写屏障机制 - Code2020 - 博客园 (cnblogs.com)

Golang 垃圾回收机制 有没有详细深入过? (qq.com)

总结

垃圾回收算法

垃圾回收算法 描述 代表语言 优缺点
引用计数 为每个对象维护一个引用计数,记录对象被引用的次数
每当一个对象被引用时,引用计数就会增加。
当对象不再被引用时,引用计数就会减少。
如果对象的引用计数变为 0,
则对象可以被垃圾回收器回收
PythonPHP 优点
实现简单,处理快
缺点
无法处理循环引用,两个对象相互引用,计数永远不为 0
分代收集 按照对象生命周期长短划分不同的代空间,
生命周期长的放入老年代,短的放入新生代,
不同代有不同的回收算法和回收频率
Java 优点
性能好
缺点
需要 STW,算法复杂
三色标记法 从根变量开始遍历所有引用的对象,标记引用的对象为不同颜色,
被标记为白色的对象进行回收
Golang 优点
解决了引用计数的缺点
缺点
需要 STW,暂时停掉程序运行

以上都需要 STW

三色标记

简介

v1.13 之前,go 使用的是 标记-清除法,需要 stw ,效率极低;

v1.15 之后,go 采用 三色标记 + 混合写屏障 极大的降低 stw 的时间,提高 gc 性能

三色标记白色(清除对象) + 灰色(过渡对象,受保护, 最终变黑色) + 黑色(受保护)

可达对象引用关系举例

可达的意思就是可以关联到的,有对象引用它了

对象1 = 对象2 // 对象2可达,对象1引用了对象2,对象2 被 对象1 引用
对象1 = 对象3
对象2 = 对象3
对象2 = 对象5

三色标记-流程

    1. 初始时,所有对象被标记为白色
    1. gc 开始,遍历 rootset 根节点,将有引用对象的对象标记为 灰色,存入灰色对象列表
    1. 遍历 灰色对象,将直接可达对象标记为 灰色,并将自身标记为 黑色
    1. 重复第 3 步,直到标记完所有的对象 (灰色对象列表为空)
    1. 将白色对象清除,保留黑色对象

image-20230413112723437

混合写屏障

三色标记存在并发问题

在三色标记期间,如果没有 STW,并发创建对象,可能存在 == 垃圾对象或误删对象 == 的情况:

    1. ==黑色对象的引用对象被删除==,则不可达,正常黑色对象应该被回收,但是 gc 期间只会循环遍历灰色列表,不会回收黑色对象,因此该对象为垃圾对象 ==(多余垃圾对象)==

      eg:对象 1 已经被标记为黑色,表示该对象有引用方,受保护,如果没有 stw,该对象的引用可能被删除,正常应该转为白色对象被清除,然 gc 并不会清除黑色对象

    1. ==黑色对象引用了白色对象==,白色对象有了引用对象应该被保护,但仍然被无情的回收 ==(清掉不该清的对象)==

    ​ 白色对象只有被灰色对象引用情况,才会判断是否需要清理,白色对象如果在 gc 期间引用了黑色对象,那只会被误删除

所以 go 引入了 混合写屏障 机制,满足:

  • 强三色不变式:黑色对象不允许引用了白色对象;因为一旦引用,该黑色对象将不会继续参与 gc,白色对象会被无理清除
  • 弱三色不变式:黑色对象可以引用白色对象,但该白色对象必须被其它灰色对象或其上游有灰色对象引用,否则该白色对象将被无理清除

这里需要注意一点,插入屏障仅会在堆内存中生效,不对栈内存空间生效,这是因为 go 在并发运行时,大部分的操作都发生在栈上,函数调用会非常频繁。数十万 goroutine 的栈都进行屏障保护自然会有性能问题

所以 gc 期间,任何在栈上新创建的对象,均为黑色。

混合写屏障 开启期间 描述
插入写屏障 创建的新对象为灰色对象 满足:强三色不变式。
不会存在黑色对象引用白色对象
删除写屏障 被删除的对象,如果自身为灰色或者白色,那么被标记为灰色 满足:弱三色不变式
(保护灰色对象到白色对象的路径不会断)

优缺点

优点:

减少 stw 时间,三色标记需要 stw 整个程序,混合写屏障(分段 stw)可以有效降低 stw 的时间

缺点:

回收精度低,有些垃圾需要在下一轮 gc 清理

完整的 gc 流程

三色标记 + 混合写屏障

  • 标记准备(Mark Setup):开启混合写屏障(Write Barrier),需 STW(stop the world)
  • 标记开始(Marking):使用三色标记法并发标记 ,与用户程序并发执行
  • 标记终止(Mark Termination):对触发写屏障的对象进行重新扫描标记,关闭写屏障(Write Barrier),需 STW(stop the world)
  • 清理(Sweeping):将需要回收的内存归还到堆中,将过多的内存归还给操作系统,与用户程序并发执行

源码

/go/1.18.3/libexec/src/runtime/mgc.go

常见问题

gc 多久执行一次,什么时候触发

  • 定时触发:Go 运行时系统会根据一定的时间间隔定期触发垃圾回收。时间间隔根据程序的内存使用情况和性能需求进行自适应调整
  • 内存分配触发:当程序申请的内存超过一定阈值时,Go 运行时会触发垃圾回收,以防止过度使用内存
  • 栈伸缩触发:当 Goroutine 的栈空间不足以容纳当前的执行需要时,Go 运行时会触发垃圾回收来扩展栈空间
  • 主动触发:调用 runtime.GC
  • 空间不足时触发: 当前线程的内存管理单元中不存在空闲空间时,创建 32KB 以下的对象可能触发垃圾收集,创建 32KB 以上的对象时,一定会尝试触发

为什么混合写屏障不保护栈的引用

因为 go 在并发运行时,大部分的操作都发生在栈上,函数调用会非常频繁。数十万 goroutine 的栈都进行屏障保护自然会有性能问题

gc 过程中那一部分使用了 STW(不是很明确)

  • 标记阶段

    GC 需要遍历程序中的所有对象,标记哪些对象是活跃的,哪些对象是可以回收的。

    为了保证标记过程的正确性,Go 语言的 GC 采用了 STW 技术,

    在标记阶段开始前会进行一次 STW,暂停所有 goroutine 的执行,然后再进行标记操作

  • 清扫阶段

    在清扫阶段,GC 会遍历堆中的所有未标记对象,将它们进行回收。

    与标记阶段类似,清扫阶段也需要使用 STW 技术,暂停所有 goroutine 的执行,然后进行清扫操作。