深入理解JVM垃圾回收机制

Zad • 2023-05-03 18:06 • 杂文

GC(Garbage Collection)垃圾回收器

在我们程序运行中会不断创建新的对象，这些对象会存储在内存中，如果没有一套机制来回收这些内存，那么被占用的内存会越来越多，可用内存会越来越少，直至内存被消耗完。于是就有了一套垃圾回收机制来做这件维持系统平衡的任务。

需要GC的原因：

1.确保被引用对象的内存不被错误的回收
2.回收不再被引用的对象的内存空间

可回收对象的判定法：

1.引用计数法

给对象中添加一个引用计数器，每当有一个地方引用它时，计数器值就加1；当引用失效时，计数器值就减1；任何时刻计数器为0的对象就是不可能再被使用的。

优点：引用计数收集器可以很快地执行，交织在程序的运行之中。
缺点：很难处理循环引用，比如上图中相互引用的两个对象，计数器不为0，则无法释放，但是这样的对象存在是没有意义的，空占内存了。

引用计数法处理不了的相互引用的问题，那么就有了可达性分析来解决了这个问题。

2.可达性分析算法（根搜索算法）

即为GC RootSet，是这些对象的集合。
从GC Roots作为起点，向下搜索它们引用的对象，可以生成一棵引用树，树的节点视为可达对象，反之最终不能与GC Roots有引用关系的视为不可达，不可达对象即为垃圾回收对象。

我自己的理解是，皇室家族每过一段时间，会进行皇室成员排查，从皇室第一代开始往下找血缘关系的后代，如果你跟第一代皇室没有关系，那么你就会被剔除皇室家族。

可作为GC Roots的对象

1.虚拟机栈中引用的对象（正在运行的方法使用到的变量、参数等）
2.方法区中类静态属性引用的对象（static关键字声明的字段）
3.方法区中常量引用的对象，(也就是final关键字声明的字段)
4.本地方法栈中引用的对象（native方法）
但是GC Roots实际不止这4种。比如还有class对象，异常处理对象Exception，类加载器。

可回收对象的场景：

1.显示地赋予某个对象为null，切断可达性

public class Isalive {
    public Object instance =null;

    public static void main(String[] args) {
        Isalive objectA = new Isalive();//objectA 局部变量表 GCRoots
        Isalive objectB = new Isalive();//objectB 局部变量表
        //相互引用
        objectA.instance = objectB;
        objectB.instance = objectA;
        //切断可达
        objectA =null;
        objectB =null;
        //强制垃圾回收
        System.gc();
    }
}

在main方法中创建objectA、objectB两个局部变量，而且相互引用。相互引用直接调System.gc()是回收不了的。而将两者都置为null，切断相互引用，切断了可达性，与GCRoots无引用，那么这两个对象就会被回收调。

2.将对象的引用指向另一个对象

Object one = new Object();  
Object two = new Object();
one = two;

这里将one的引用也指向了two引用指向的对象，那么one原本指向的对象就失去了GCRoots引用，这里就判断该对象可被回收。

3.局部对象的使用

void fun(){
        Object object = new Object();
        ...
}

当方法执行完，局部变量object对象会被判定为可回收对象。

4.只有软、弱、虚引用与之关联
new出来的对象被强引用了，就需要去掉强引用，改为弱引用。被弱引用之后，需要置空来干掉强引用，达到随时可回收的效果。

    User u = new User(); //new是强引用
    SoftReference userSoft = new SoftReference(u);//软引用
    u = null;//干掉强引用，确保这个实例只有userSoft的软引用

只被软引用的对象在内存不足的情况，可能会被GC回收掉。

        User u = new User();
        WeakReference userWeak = new WeakReference(u);
        u = null;//干掉强引用，确保这个实例只有userWeak的弱引用

只被弱引用持有的对象，随时都可能被GC回收，该对象就为可回收对象。

finalize方法

是不是被判定为了可回收对象，就一定会被回收了呢。其实Object类中还有一个finalize方法。这个方法是对象在被GC回收之前会被触发的方法。

public class Object {
    protected void finalize() throws Throwable { }
}

该方法翻译过来就是：当垃圾回收确定不再有对该对象的引用时，由垃圾回收器在对象上调用。子类重写finalize方法以处置系统资源或执行其他清除。说人话就是对象死前会给你一个回光返照，让你清醒一下，想干什么就干什么，甚至可以把自己救活。我们可以通过重写finalize方法，来让对象复活一下。

示例：

/**
 * 对象的自我拯救
 */
public class FinalizeGC {
    public static FinalizeGC instance = null;
    public void isAlive(){
        System.out.println("I am still alive!");
    }
    @Override
    protected void finalize() throws Throwable{
        super.finalize();
        System.out.println("finalize method executed");
        FinalizeGC.instance = this;
    }
    public static void main(String[] args) throws Throwable {
        instance = new FinalizeGC();
        //对象进行第1次GC
        instance =null;
        System.gc();
        //Thread.sleep(1000);//Finalizer方法优先级很低，需要等待
        if(instance !=null){
            instance.isAlive();
        }else{
            System.out.println("I am dead！");
        }
        //对象进行第2次GC
        instance =null;
        System.gc();
        //Thread.sleep(1000);
        if(instance !=null){
            instance.isAlive();
        }else{
            System.out.println("I am dead！");
        }
    }
}

执行的结果：

这里我们重写FinalizeGC类的finalize方法，使用FinalizeGC.instance = this语句，让对象又有了引用，不再被判定为可回收对象，这里就活了。然后再置空再回收一下，这个对象就死了，没有再被救活了。所以finalize方法只能被执行一次，没有再次被救活的机会。

对象的分配策略

对象优先在Eden分配
大多数情况下，对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时，虚拟机将发起一次Minor GC。
大对象直接进入老年代
所谓的大对象是指，需要大量连续内存空间的Java对象，最典型的大对象就是那种很长的字符串以及数组。
长期存活的对象将进入老年代
为了在内存回收时能识别哪些对象应放在新生代，哪些对象应放在老年代中。虚拟机给每个对象定义了一个对象年龄（Age）计数器。

对象年龄的判定：
如果对象在Eden出生并经过第一次Minor GC后仍然存活，并且能被Survivor容纳的话，将被移动到Survivor空间中，并且对象年龄设为1。
对象在Survivor区中每“熬过”一次Minor GC，年龄就增加1岁，当它的年龄增加到一定程度（默认为15岁），这个15岁跟2的4次方有关。就将会被晋升到老年代中。
对象晋升老年代的年龄阈值，可以通过参数-XX:MaxTenuringThreshold设置。

动态对象年龄判定
如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代，无须等到MaxTenuringThreshold中要求的年龄。
空间分配担保
当新生代对象要晋级到老年代时，JVM能确保老年代的空间能够放得下这些对象。

逃逸分析

逃逸分析，是一种可以有效减少Java 程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。通过逃逸分析，Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。

逃逸分析的好处
如果一个对象不会在方法体内，或线程内发生逃逸（或者说是通过逃逸分析后，认定其未能发生逃逸），就可以做如下优化：

栈上分配：
一般情况下，不会逃逸的对象所占空间比较大，如果能使用栈上的空间，那么大量的对象将随方法的结束而销毁，减轻了GC压力
同步消除：
如果你定义的类的方法上有同步锁，但在运行时，却只有一个线程在访问，此时逃逸分析后的机器码，会去掉同步锁运行。

垃圾收集算法

元空间的概念

在JDK1.8版本废弃了永久代，替代的是元空间（MetaSpace），元空间与永久代上类似，都是方法区的实现，他们最大区别是：元空间并不在JVM中，而是使用本地内存。
元空间有注意有两个参数：

MetaspaceSize ：初始化元空间大小，控制发生GC阈值
MaxMetaspaceSize ：限制元空间大小上限，防止异常占用过多物理内存
为什么移除永久代？
移除永久代原因：为融合HotSpot JVM与JRockit VM（新JVM技术）而做出的改变，因为JRockit没有永久代。
有了元空间就不再会出现永久代OOM问题了！

1.Generational Collection（分代收集）算法

分代收集算法是GC垃圾回收算法的总纲领。现在主流的Java虚拟机的垃圾收集器都采用分代收集算法。Java 堆区基于分代的概念，分为新生代（Young Generation）和老年代（Tenured Generation），其中新生代再细分为Eden空间、From Survivor空间和To Survivor空间。 (Survivor：幸存者)

分代收集算法会结合不同的收集算法来处理不同的空间，因此在学习分代收集算法之前我们首先要了解Java堆区的空间划分。Java堆区的空间划分在Java虚拟机中，各种对象的生命周期会有着较大的差别。因此，应该对不同生命周期的对象采取不同的收集策略，根据生命周期长短将它们分别放到不同的区域，并在不同的区域采用不同的收集算法，这就是分代的概念。

当执行一次GC Collection时，Eden空间的存活对象会被复制到To Survivor空间，并且之前经过一次GC Collection并在From Survivor空间存活的仍年轻的对象也会复制到To Survivor空间。

对象进入到From和To区之后，对象的GC分代年龄ege的属性，每经过GC回收存活下来，ege就会+1，当ege达到15了，对象就会晋级到老年代。

2.Mark-Sweep（标记-清除）算法

标记清除：标记阶段的任务是标记出所有需要被回收的对象，清除阶段就是回收被标记的对象所占用的空间。标记-清除算法主要是运用在Eden区，该区对象很容易被回收掉，回收率很高。

优点是简单，容易实现。
缺点是容易产生内存碎片。

3.Copying（复制）算法

复制算法的使用在From区和To区，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用的内存空间一次清理掉，这样一来就不容易出现内存碎片的问题。

缺点：可使用内存缩减为一半大小。

那么复制算法使可使用内存大小会减半，设计上是怎么解决这个问题的呢。就是给From和To区划分尽可能小的区域。经过大数据统计之后，对象在第一次使用过后，绝大多数都会被回收，所以能进入第一次复制算法的对象只占10%。那么设计上，Eden、From、To区的比例是8:1:1，绝大多数对象会分配到Eden区，这样就解决了复制算法缩减可用内存带来的问题。

4.Mark-Compact (标记—整理)算法

在新生代中可以使用复制算法，但是在老年代就不能选择复制算法了，因为老年代的对象存活率会较高，这样会有较多的复制操作，导致效率变低。标记—清除算法可以应用在老年代中，但是它效率不高，在内存回收后容易产生大量内存碎片。因此就出现了一种标记—整理算法，与标记—清除算法不同的是，在标记可回收的对象后将所有存活的对象压缩到内存的一端，使它们紧凑地排列在一起，然后对边界以外的内存进行回收，回收后，已用和未用的内存都各自一边。

垃圾收集器

垃圾收集算法是内存回收的方法论，那么垃圾收集器就是内存回收的具体实现：
Serial 收集器（复制算法): 新生代单线程收集器，标记和清理都是单线程，
优点是简单高效；
Serial Old 收集器 (标记-整理算法): 老年代单线程收集器，Serial 收集器
的老年代版本；
ParNew 收集器 (复制算法): 新生代收并行集器，实际上是 Serial 收集器
的多线程版本，在多核 CPU 环境下有着比 Serial 更好的表现；
CMS(Concurrent Mark Sweep)收集器（标记-清除算法）：老年代并行
收集器，以获取最短回收停顿时间为目标的收集器，具有高并发、低停顿
的特点，追求最短 GC 回收停顿时间。

参考：
https://blog.csdn.net/luzhensmart/article/details/87902706

版权声明：
作者：Zad
链接：https://www.techfm.club/p/45345.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

大数据

二维码

《沉思录》语录（2）

< <上一篇

How to Fix the “err_connection_timed_out” Error

下一篇>>

搜索内容