RELATEED CONSULTING
相关咨询
选择下列产品马上在线沟通
服务时间:8:30-17:00
你可能遇到了下面的问题
关闭右侧工具栏

新闻中心

这里有您想知道的互联网营销解决方案
go语言的gc go语言的优势

go的垃圾回收算法

从Gov1.12版本开始,Go使用了非分代的、并发的、基于三色标记清除的垃圾回收器。

创新互联公司是一家从事企业网站建设、网站设计、成都网站设计、行业门户网站建设、网页设计制作的专业网络公司,拥有经验丰富的网站建设工程师和网页设计人员,具备各种规模与类型网站建设的实力,在网站建设领域树立了自己独特的设计风格。自公司成立以来曾独立设计制作的站点上千。

关于垃圾回收,比较常见的算法有引用计数、标记清除和分代收集,Golang语言使用的垃圾回收算法是标记清除。

Golang语言的标记清除垃圾回收算法,为了防止GC扫描时内存变化引起的混乱。那么就需要 STW,即Stop The World。具体在Golang语言中是指,在GC时先停止所有goroutine。再进行垃圾回收,等待垃圾回收结束后再恢复所有被停止的goroutine。

标记清除方法

启动STW,暂停程序的业务逻辑,找出不可达对象和可达对象。

将所有可达对象做标记,清除未标记的对象。停止STW,程序继续执行。循环往复,直到进程程序生命周期结束。因为STW需要暂停程序,为了减少暂停程序的时间。将清除操作移出 STW执行周期,但是优化效果不明显。

所谓三色标记,实际上只是为了方便叙述而抽象出来的一种说法,三色对应垃圾回收过程中对象的三种状态。白色是对象未被标记,gcmarkBits对应位为0,该对象将会在本次GC中被清理。灰色是对象还在标记队列中等待被标记,黑色是对象已被标记,gcmarkBits对应位为0,该对象将会在本次 GC中被回收。

Go GC 简介

GC 与 mutator 线程并发运行,允许多个 GC 线程并行运行

GC 是一个使用写屏障的并发标记和清除。

GC 是非分代的,非紧凑的。

Allocation 是按照大小隔离每个 P 分配的区域来完成的,以在消除常见情况下的锁的同时,最小化碎片。

了解 GC 的好地方,可以从 Richard Jones 的 gchandbook.org 开始。

1. GC 执行清除终止

  a. Stop the world ,这将导致所有 P 达到 GC 安全点。

  b. 清除任何未清除过的 spans ,只有在预期时间之前强制执行此 GC 周期时,才会有未清除的 span 。

2. GC 执行标记阶段

  a.   准备标记阶段,将 gcphase 设置为 _GCmark (从 _GCoff 开始),启用写屏障,启用 mutator assist ,并对根标记作业进行排队。

在所有 P 都启用写屏障之前,不会扫描任何对象,这是使用 STW 完成的。

   b. Start the world ,从现在开始,GC 工作由调度器启动的 标记worker 和作 为 allocation 的一部分执行的 assists 来完成。

写屏障将覆写的指针和任何指针写的新指针值都着色。

新分配的对象立即被标记为黑色。

  c.   GC 执行根标记作业。包括: 扫描所有栈 , 着色所有全局变量 ,以及 着色堆外运行时数据结构中的任何堆指针 。

扫描栈会停止goroutine,对goroutine栈中找到的任何指针进行着色,然后恢复goroutine。

    d.   GC 耗尽灰色对象的工作队列,将每个 灰色 对象扫描为 黑色 ,并对在该对象中找到的所有指针进行着色(反过来可能会将这些指针添加到工作队列中)。

   e.   由于 GC work 分散在本地缓存中,因此 GC 使用 分布式终止算法 来检测何时不再有根标记作业或灰色对象(参见 gcMarkDone 函数)。

此时,GC 状态转换到标记终止( gcMarkTermination )。

3. GC 执行标记终止 gcMarkTermination

  a. Stop the world

  b. 将 gcphase 设置为 _GCmarktermination ,并禁用 workers 和 assists。

  c. 进行内务整理,如 flushing mcaches

4. GC 执行清除阶段

   a. 准备清除阶段,将 gcphase 设置为 _GCoff ,设置清除状态并禁用写屏障。

  b. Start the world ,从现在开始,新分配的对象是白色的,如有必要,在使用 spans 前 allocating 清除 spans 。

   c. GC 在后台进行 并发清除 并响应 allocation ,见下面的描述。

5. 当分配足够时,重复上面 1 开始的步骤,参见下面关于 GC rate 的讨论。

清除阶段与正常程序执行并发进行。

在后台 goroutine 中,堆被惰性(当 goroutine 需要另一个 span 时)且并发地逐个 span 扫描(这有助于不是 CPU bound 的程序)。

在 STW 标记终止 的结尾,所有的 span 都被标记为 需要清除 。

后台清除器 goroutine 简单地逐个清除 span 。

为了避免在存在未清除的 span 时请求更多的 OS内存 ,当 goroutine 需要另一个 span 时,它首先尝试通过清除来回收这些内存。

当 goroutine 需要分配一个新的 小对象span 时,它会清除相同大小的小对象 span ,直到释放至少一个对象为止。

当 goroutine 需要从堆中分配 大对象span 时,它会清除 span ,直到将至少那么多页面释放到堆中。

有一种情况,这可能是不够的:如果 goroutine 清除并释放两个不相邻的 单页span 到堆中,那么它将分配一个新的 双页span ,但是仍然可以有其他 单页未清除的span ,可以组合成 双页的span 。

确保在未清除的 span 上不进行任何操作(这会破坏 GC 位图中的标记位)至关重要。

在 GC 期间,所有 mcache 都被刷新到 中央缓存 中,因此它们是空的。

当一个 goroutine 抓取一个新的 span 到 mcache 时, goroutine 会清除 mcache 。

当 goroutine 显式释放对象或设置 finalizer 时,goroutine 确保 span 已经清除(通过清除或者等待并发清除完成)。

finalizer goroutine 仅在所有 span 已经清除时才开始。

当下一次 GC 启动时,它将清除所有尚未清除的 span (如果有的话)。

下一次 GC 是在我们分配了与已经使用的内存成正比的额外内存量之后。

该比例由 GOGC 环境变量控制(默认为 100 )。

如果 GOGC=100 ,而我们使用的是 4M ,那么当达到 8M 时,我们将再次进行 GC(此标记在 next_gc 变量中被跟踪)。

获取 GOGC :

这使得 GC成本 与 allocation 成本 成线性比例。

调整 GOGC 只会改变线性常量(以及使用的额外内存量)。

为了防止在扫描大型对象时出现长时间的暂停,并提高并行性,垃圾收集器将大于 maxObletBytes 的对象的扫描作业分解为最多 maxObletBytes 的 oblets 。

当扫描遇到大对象时,它只扫描第一个 oblet ,并将其余 oblets 作为新的扫描作业排队。

Golang什么时候会触发GC

Golang采用了三色标记法来进行垃圾回收,那么在什么场景下会触发这个回收动作呢?

源码主要位于文件 src/runtime/mgc.go go version 1.16

触发条件从大方面说,可分为 手动触发 和 系统触发 两种方式。手动触发一般很少用,主要由开发者通过调用 runtime.GC() 函数来实现,而对于系统自动触发是 运行时 根据一些条件判断来进行的,这也正是本文要介绍的内容。

不管哪种触发方式,底层回收机制是一样的,所以我们先看一下手动触发,根据它来找系统触发的条件。

可以看到开始执行GC的是 gcStart() 函数,它有一个 gcTrigger 参数,是一个触发条件结构体,它的结构体也很简单。

其实在Golang 内部所有的GC都是通过 gcStart() 函数,然后指定一个 gcTrigger 的参数来开始的,而手动触发指定的条件值为 gcTriggerCycle 。 gcStart 是一个很复杂的函数,有兴趣的可以看一下源码实现。

对于 kind 的值有三种,分别为 gcTriggerHeap 、 gcTriggerTime 和 gcTriggerCycle 。

运行时会通过 gcTrigger.test() 函数来决定是否需要触发GC,只要满足上面基中一个即可。

到此我们基本明白了这三种触发GC的条件,那么对于系统自动触发这种,Golang 从一个程序的开始到运行,它又是如何一步一步监控到这个条件的呢?

其实 runtime 在程序启动时,会在一个初始化函数 init() 里启用一个 forcegchelper() 函数,这个函数位于 proc.go 文件。

为了减少系统资源占用,在 forcegchelper 函数里会通过 goparkunlock() 函数主动让自己陷入休眠,以后由 sysmon() 监控线程根据条件来恢复这个gc goroutine。

可以看到 sysmon() 会在一个 for 语句里一直判断这个 gcTriggerTime 这个条件是否满足,如果满足的话,会将 forcegc.g 这个 goroutine 添加到全局队列里进行调度(这里 forcegc 是一个全局变量)。

调度器在调度循环 runtime.schedule 中还可以通过垃圾收集控制器的 runtime.gcControllerState.findRunnabledGCWorker 获取并执行用于后台标记的任务。


标题名称:go语言的gc go语言的优势
本文路径:http://scpingwu.com/article/dooiodp.html