原文:Erlang进程堆垃圾回收机制

作者:http://blog.csdn.net/mycwq

每一个Erlang进程创建之后都会有自己的PCB,栈,私有堆。erlang不知道他创建的进程会用到哪种场合下,所以一開始分配的内存比較小。假设分配的空间不够了,erlang gc会动态调整堆大小以满足需求,假设分配的空间大了,就会收缩堆,回收内存。

erlang进程堆的gc是分代gc。分代gc的想法基于统计学:大部分数据的生存周期都比較短,最新的数据更easy不再被使用。

这里erlang使用young heap 和old heap来区分数据。young heap放新数据,old heap放旧数据,也就是gc后存活的数据。

erlang进程堆gc有两个主要过程:浅扫描和深扫描

浅扫描(minor collection)

浅扫描是当young heap空间不足时,erlang会对young heap做一次扫描。把实用的数据拷贝到新申请的young heap空间。发现已经扫描过1次以上的数据放入old heap,然后删掉原来的young heap

在young heap中,erlang使用了高水位线来区分标记一次以上的数据和未标记的数据,那么young heap移入old heap的就是超过高水位线的数据

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbXljd3E=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

深扫描(major collection)

深扫描是一般当old heap空间不足时触发,erlang会对young heap和old heap做扫描,把实用的数据放入新申请的young heap,删掉原来的heap

深扫描的触发条件还有手动运行gc,和gc次数超过fullsweep_after的參数限定

控制垃圾回收

以游戏网关进程为例,网关进程通常有大量消息,而大部分消息都仅仅是在网关这里做转发,生命周期非常短,所以网关进程能够设定较大的初始内存,较快的内存回收。

spawn_opt(Fun, [{min_heap_size, 5000},{min_bin_vheap_size, 100000},{fullsweep_after, 500}])

先看下參数默认值:

1> erlang:system_info(min_heap_size).

{min_heap_size,233}

2> erlang:system_info(min_bin_vheap_size).

{min_bin_vheap_size,46368}

3> erlang:system_info(fullsweep_after).

{fullsweep_after,65535}

min_heap_size是进程最小堆大小

这个參数两个地方会用到,第一处是erlang初始化进程堆大小,第二处是gc后堆收缩后维持的最小值。min_bin_vheap_size是进程最小虚拟二进制堆大小。这两个參数都是以word为单位。初始化足够大的初始内存,能够降低轻度gc的次数。降低重复申请和回收内存的开销

fullsweep_after控制深扫描的频率

这个參数确定多少次gc后运行一次深度gc。默认值为65536,有点大了

所以。上面3个參数配合起来的意义就是。进程初始化分配足够大的内存,降低重复申请内存的开销。当申请的内存不够用。gc会又一次申请内存,累计达到500次就做一次gc

手动运行垃圾回收

上面提到了利用fullsweep_after来控制gc的情况,以下再介绍手动gc的情况:

在rabbitMQ看到这段代码,能够在项目中定期运行这个函数:

gc() ->

    [erlang:garbage_collect(P) || P <- erlang:processes(),

                           {status, waiting} == erlang:process_info(P, status)],

    erlang:garbage_collect(),

    ok.

当然,你还能够增加一些推断,比方指定占内存过50M的进程运行gc

erlang进程占用多少内存

用以下这种方法检查erlang进程占用的内存。你能够换别的參数再试试

Fun = fun()-> receive after infinity -> ok end end.

erlang:process_info(erlang:spawn(Fun), memory).



erlang垃圾回收的副作用

前面讲到erlang进程堆的gc是分代gc的,这个仅仅是全局层面的,在底层erlang还是走了标记清除的路子。标记清除这样的gc方式是定期运行的。首先gc不够及时。其次,在gc运行期间开销比較大。会引起中断。

只是每一个erlang进程的堆区域是独立的,gc能够独立进行,加上它内存区域比較小,还有erlang的变量是单次赋值,无需多次追踪,因此,erlang进程gc的延迟不会引起全局的中断

erlang文档參考

GC in Erlang works independently on each Erlang process, i.e. each Erlang process has its own heap, and that heap is GCed independently of other processes' heaps.

The current default GC is a "stop the world" generational mark-sweep collector. On Erlang systems running with multiple threads (the default on systems with more than one core), GC stops work on the Erlang process being GCed, but other Erlang processes on other
OS threads within the same VM continue to run. The time the process spends stopped is normally short because the size of one process' heap is normally relatively small; much smaller than the combined size of all processes heaps.

结束语

这里讲了erlang进程堆的gc,另外erlang还有其它gc机制,比方,二进制共享堆和进程外堆碎片是引用计数gc,这里先不做讨论,有时间我会在下篇做讨论,有兴趣能够看这里了解一下。


參考:

http://blog.csdn.net/mycwq/article/details/26613275

http://www.cnblogs.com/me-sa/archive/2011/11/13/erlang0014.html

Erlang进程堆垃圾回收机制的更多相关文章

  1. erlang二进制数据垃圾回收机制

    erlang二进制数据在内存中有两种存在形式,当数据大小不到 64 bytes,就直接存在进程堆内.假设超过了64 bytes.就被保存到进程外的共享堆里,能够给节点内全部进程共享. erlang有两 ...

  2. Erlang垃圾回收机制的二三事

    声明:本片文章是由Hackernews上的[Erlang Garbage Collection Details and Why ItMatters][1]编译而来,本着学习和研究的态度,进行的编译,转 ...

  3. 深入了解Erlang 垃圾回收机制以及其重要性(转)

    声明:本片文章是由Hackernews上的[Erlang Garbage Collection Details and Why ItMatters][1]编译而来,本着学习和研究的态度,进行的编译,转 ...

  4. 巩固java(二)----JVM堆内存结构及垃圾回收机制

    前言:        我们在运行程序时,有时会碰到内存溢出(OutOfMemoryError)的问题,为了解决这种问题,我们有必要了解JVM的内存结构和垃圾回收机制. 正文: 1.JVM堆内存结构   ...

  5. .net垃圾回收机制编程调试试验

    1. 什么是CLR GC? 它是一个基于引用跟踪和代的垃圾回收器. 从本质上,它为系统中所有活跃对象都实现了一种引用跟踪模式,如果一个对象没有任何引用指向它,那么这个对象就被认为是垃圾对象,并且可以被 ...

  6. JVM的生命周期、体系结构、内存管理和垃圾回收机制

    一.JVM的生命周期 JVM实例:一个独立运行的java程序,是进程级别 JVM执行引擎:用户运行程序的线程,是JVM实例的一部分 JVM实例的诞生 当启动一个java程序时.一个JVM实例就诞生了, ...

  7. JVM的垃圾回收机制详解和调优

    JVM的垃圾回收机制详解和调优 gc即垃圾收集机制是指jvm用于释放那些不再使用的对象所占用的内存.java语言并不要求jvm有gc,也没有规定gc如何工作.不过常用的jvm都有gc,而且大多数gc都 ...

  8. java JVM垃圾回收机制

    Java语言出来之前,大家都在拼命的写C或者C++的程序,而此时存在一个很大的矛盾,C++等语言创建对象要不断的去开辟空间,不用的时候有需要不断的去释放控件,既要写构造函数,又要写析构函数,很多时候都 ...

  9. asp.net 之 GC (垃圾回收机制)

    今天抽时间好好整理了下GC相关知识,看了CSDN和博客园的几篇文章,有了一定的简单了解,决定根据个人理解整合一份随笔写下来,望诸位指教. 一:基础问题 1.首先需要知道了解什么是GC? GC如其名,就 ...

随机推荐

  1. Hi3519V101 Uboot和Kernel编译

    前面已经搭建好了Ubuntu下的海思开发环境,现在对编译Uboot和Kernel的过程做一个简单的记录.参考文档<Hi3519V101 U-boot 移植应用开发指南.pdf>和<H ...

  2. 【02】markdown工具推荐

    [02]信息 Windows 平台 MarkdownPad MarkPad Linux 平台 ReText Mac 平台 Mou 最新版Mac OS下Mou已经无法使用了.这里推荐一个跨平台的编辑器  ...

  3. Wp8无广告 锁屏可以持续用的手电筒

    前面的博文写了怎么实现手电筒,界面不够漂亮 我修改了界面之后 提交到了微软的App商店 在这里送上下载地址: http://www.windowsphone.com/zh-cn/store/app/% ...

  4. python-通过openpy操作excel

    1.安装 openpyxl pip install openpyxl == 2.3.5  安装指定版本 遇到问题: 查询结果:这是因为电脑上有其他软件也有pip命令,我的电脑上是因为装了loadrun ...

  5. zoj 2388 Beat the Spread!

    Beat the Spread! Time Limit: 2 Seconds      Memory Limit: 65536 KB Superbowl Sunday is nearly here. ...

  6. POJ 2106-Boolean Expressions,双栈运用类似表达式求值!

    Boolean Expressions 首先声明此题后台可能极水(毕竟这种数据不好造!).昨天写了一天却总是找不到bug,讨论区各种数据都过了,甚至怀疑输入有问题,但看到gets也可以过,难道是思路错 ...

  7. POJ 1606 Jugs

    Jugs Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 4280   Accepted: 2533   Special Ju ...

  8. Oracle 查看 使用 UNDO 段的事务脚本

    查看oracle undo segment段的信息: SELECT T1.USN, T2.NAME, T1.STATUS, T1.LATCH, T1.EXTENTS, T1.WRAPS, T1.EXT ...

  9. iOS学习笔记21-推送证书与秘钥申请

    ---恢复内容开始--- 一.iOS证书 iOS常用的证书包括开发证书和发布证书,无论是真机调试还是最终发布应用到App Store这两个证书都是必须的,它是iOS开发的基本证书.Xcode7以后真机 ...

  10. 刷题总结——切蛋糕(ssoj)

    题目: 切蛋糕 (cake.cpp/c/pas) [问题描述] BG 有一块细长的蛋糕,长度为�. 有一些人要来BG 家里吃蛋糕, BG把蛋糕切成了若干块(整数长度),然后分给这些人.为了公平,每个人 ...