Bootstrap

JVM--方法区

目录

● 46. JVM--方法区

1. 栈、堆、方法区的交互关系

2. 方法区的理解

3. 方法区演进过程

4. 设置方法区大小与 OOM

5. 方法区的内部结构

6. 运行时常量池

7. 方法区演进细节(非常重要)

     ● 方法区的垃圾收集主要回收两部分内容:常量池中废弃的常量和不再使用的类型。

8. 运行时数据区总结

● 面试题


● 46. JVM--方法区

1. 栈、堆、方法区的交互关系

运行时数据区: 从线程共享与否的角度来看
ThreadLocal:如何保证多个线程在并发环境下的安全性?典型应用就是数据库连接管理,以及会话管理
程序计数器不会报异常,也不存在GC。
虚拟机栈和本地方法栈会报异常,但是不存在GC。
堆和方法区既有异常又有GC。
● 栈、堆、方法区的交互关系
1、Person 类的 .class 信息存放在方法区中
2、person 变量存放在 Java 栈的局部变量表中
3、真正的 person 对象存放在 Java 堆中
4、在 person 对象中,有个指针指向方法区中的 person 类型数据,表明这个 person 对象是用方法区中的 Person 类 new 出来的

2. 方法区的理解

https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.5.4
●  怎么理解:虚拟机规范中讲方法区看做是堆的逻辑部分,但是对于HotSpotJVM实现上,将堆和方法区分开,认为是两个不同的结构,方法区还有一个别名是Non-Heap(非堆),目的就是要和堆分开。也可以理解new出来的都在堆里面,方法区里面放的是类的信息。 所以,方法区可以看作是一块独立于Java堆的内存空间。
1、方法区主要存放的是 Class,而堆中主要存放的是实例化的对象
2、方法区(Method Area)与Java堆一样,是各个线程共享的内存区域
3、方法区在JVM启动的时候被创建,并且它的实际的物理内存空间中和Java堆区一样都可以是不连续的。
4、方法区的大小,跟堆空间一样,可以选择固定大小或者可扩展。
5、方法区的大小决定了系统可以保存多少个类,如果系统定义了太多的类,导致方法区溢出,虚拟机同样会抛出内存溢出错误:
    java.lang.OutofMemoryError:PermGen space(JDK7及之前) 或者 java.lang.OutOfMemoryError:Metaspace(JDK8及之后)
    举例说明方法区 OOM
    1)加载大量的第三方的jar包
    2)Tomcat部署的工程过多(30~50个)
    3)大量动态的生成反射类
6、关闭JVM就会释放这个区域的内存。

3. 方法区演进过程

1、在 JDK7 及以前,习惯上把方法区,称为永久代。JDK8开始,使用元空间取代了永久代。JDK 1.8后,元空间存放在堆外内存中
2、我们可以将方法区类比为Java中的接口,将永久代或元空间类比为Java中具体的实现类
3、本质上,方法区和永久代并不等价。仅是对Hotspot而言的可以看作等价。《Java虚拟机规范》对如何实现方法区,不做统一要求。例如:BEAJRockit / IBM J9 中不存在永久代的概念。
4、元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代最大的区别在于:元空间不在虚拟机设置的内存中,而是使用本地内存
5、永久代、元空间二者并不只是名字变了,内部结构也调整了
6、根据《Java虚拟机规范》的规定,如果方法区无法满足新的内存分配需求时,将抛出OOM异常

4. 设置方法区大小与 OOM

方法区的大小不必是固定的,JVM可以根据应用的需要动态调整。
● JDK8 版本设置元空间大小
1、元数据区大小可以使用参数 -XX:MetaspaceSize 和 -XX:MaxMetaspaceSize 指定
2、默认值依赖于平台,Windows下,-XX:MetaspaceSize 约为21M,-XX:MaxMetaspaceSize的值是-1,即没有限制。
3、如果不指定大小,默认情况下,虚拟机会耗尽所有的可用系统内存。如果元数据区发生溢出,虚拟机一样会抛出异常OutOfMemoryError:Metaspace
  
● 方法区 OOM
/**
 * jdk8中:
 * -XX:MetaspaceSize=10m -XX:MaxMetaspaceSize=10m
 */
public class OOMTest1 extends ClassLoader {
    public static void main(String[] args) {
        int j = 0;
        try {
            OOMTest1 test = new OOMTest1();
            for (int i = 0; i < 10000; i++) {
                //创建ClassWriter对象,用于生成类的二进制字节码
                ClassWriter classWriter = new ClassWriter(0);
                //指明版本号,修饰符,类名,包名,父类,接口
                classWriter.visit(Opcodes.V1_6, Opcodes.ACC_PUBLIC, "Class" + i, null, "java/lang/Object", null);
                //返回byte[]
                byte[] code = classWriter.toByteArray();
                //类的加载
                test.defineClass("Class" + i, code, 0, code.length);//Class对象
                j++;
            }
        } finally {
            System.out.println(j);
        }
    }
}
使用默认的 JVM 参数,元空间不设置上限:打印10000
设置元空间的上限:-XX:MetaspaceSize=10m -XX:MaxMetaspaceSize=10m

5. 方法区的内部结构

不同的JDK版本字符串常量池位置会有变化。
《深入理解Java虚拟机》书中对方法区(Method Area)存储内容描述如下:它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等。
类型信息:类、接口、枚举
域信息和方法信息可以看成是涵盖在类型信息之中的。
● 类型信息:
对每个加载的类型(类class、接口interface、枚举enum、注解annotation),JVM必须在方法区中存储以下类型信息:
1、这个类型的完整有效名称(全名=包名.类名)
2、这个类型直接父类的完整有效名(对于interface或是java.lang.Object,都没有父类)
3、这个类型的修饰符(public,abstract,final的某个子集)
4、这个类型直接接口的一个有序列表
● 域(Field)信息:
1、JVM必须在方法区中保存类型的所有域的相关信息以及域的声明顺序。
2、域的相关信息包括:
     域名称
     域类型
     域修饰符(public,private,protected,static,final,volatile,transient的某个子集)
● 方法(Method)信息
JVM必须保存所有方法的以下信息,同域信息一样包括声明顺序:
1、方法名称
2、方法的返回类型(包括 void 返回类型)
3、方法参数的数量和类型(按顺序)
4、方法的修饰符(public,private,protected,static,final,synchronized,native,abstract的一个子集)
5、方法的字节码(bytecodes)、操作数栈、局部变量表及大小(abstract和native方法除外)
6、异常表(abstract和native方法除外),异常表记录每个异常处理的开始位置、结束位置、代码处理在程序计数器中的偏移地址、被捕获的异常类的常量池索引
/**
 * 测试方法区的内部构成
 */
public class MethodInnerStrucTest extends Object implements Comparable<String>,Serializable {
    //属性
    public int num = 10;
    private static String str = "测试方法的内部结构";
    //构造器
    //方法
    public void test1(){
        int count = 20;
        System.out.println("count = " + count);
    }
    public static int test2(int cal){
        int result = 0;
        try {
            int value = 30;
            result = value / cal;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return result;
    }

    @Override
    public int compareTo(String o) {
        return 0;
    }
}
反编译字节码文件
参数 -p 确保能查看 private 权限类型的字段或方法
javap -v -p MethodInnerStrucTest.class > text.txt
● non-final 类型的类变量static
1、静态变量和类关联在一起,随着类的加载而加载,他们成为类数据在逻辑上的一部分
2、类变量被类的所有实例共享,即使没有类实例时,你也可以访问它
/**
 * non-final的类变量
 */
public class MethodAreaTest {
    public static void main(String[] args) {
        Order order = null;
        order.hello();
        System.out.println(order.count);
    }
}

class Order {
    public static int count = 1;
    public static final int number = 2;

    public static void hello() {
        System.out.println("hello!");
    }
}
程序运行结果 
hello! 
1
即使我们把order设置为null,也不会出现空指针异常
这更加表明了 static 类型的字段和方法随着类的加载而加载,并不属于特定的类实例
● 全局常量:static final
1、全局常量就是使用 static final 进行修饰
2、被声明为final的类变量的处理方法则不同,每个全局常量在编译的时候就会被分配了。

6. 运行时常量池

1、方法区,内部包含了运行时常量池
2、字节码文件,内部包含了常量池
将字节码文件中的常量池加载到方法区就是运行时常量池
● 常量池:
一个有效的字节码文件中除了包含类的版本信息、字段、方法以及接口等描述符信息外
还包含一项信息就是常量池表(Constant Pool Table),包括各种字面量(10、"hello")和对类型、域和方法的符号引用
● 为什么需要常量池?
一个java源文件中的类、接口,编译后产生一个字节码文件。而Java中的字节码需要数据支持,通常这种数据会很大以至于不能直接存到字节码里,换另一种方式,可以存到常量池
这个字节码包含了指向常量池的引用。在动态链接的时候会用到运行时常量池,之前有介绍
public class SimpleClass { 
    public void sayHello() { 
        System.out.println("hello"); 
    } 
}
1、虽然上述代码只有194字节,但是里面却使用了String、System、PrintStream及Object等结构。
2、如果不使用常量池,就需要将用到的类信息、方法信息等记录在当前的字节码文件中,造成文件臃肿
3、所以我们将所需用到的结构信息记录在常量池中,并通过引用的方式,来加载、调用所需的结构
●  常量池总结 
常量池可以看做是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等类型
  
● 运行时常量池:
1、运行时常量池(Runtime Constant Pool)是方法区的一部分。
2、常量池表(Constant Pool Table)是Class字节码文件的一部分,用于存放编译期生成的各种字面量与符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
3、JVM为每个已加载的类型(类或接口)都维护一个常量池。池中的数据项像数组项一样,是通过索引访问的。
4、运行时常量池中包含多种不同的常量,此时不再是常量池中的符号地址了,这里换为真实地址。
       
方法类似于做菜,需要用到各种配料酱油、味精、盐等,编译的时候只是写的"味精",相当于符号引用(字节码中看到的ConstantPool都是符号引用),当真正炒菜的时候要去拿真正的味 精,变成直接引用

7. 方法区演进细节(非常重要)

1、首先明确:只有Hotspot才有永久代。
      BEA JRockit、IBMJ9等来说,是不存在永久代的概念的。原则上如何实现方法区属于虚拟机实现细节,不受《Java虚拟机规范》管束,并不要求统一。
2、Hotspot中方法区的变化
元空间就是方法区的具体实现。JDK7永久代是方法区的落地实现,JDK8元空间是方法区的落地实现
  
JDK6
方法区由永久代实现,使用 JVM 虚拟机内存
JDK7
方法区由永久代实现,使用 JVM 虚拟机内存
JDK8
方法区由元空间实现,使用 物理机本地内存
static ObjectHolder staticObj = new ObjectHolder();
只要是对象实例必然会在Java堆中分配。
JDK7及其以后版本的HotSpot虚拟机选择把静态变量与对象存放在一起,存储于Java堆之中
● 永久代为什么要被元空间替代?
由于类的元数据分配在本地内存中,元空间的最大可分配空间就是系统可用内存空间,这项改动是很有必要的,原因有:
1、为永久代设置空间大小是很难确定的。
     1)在某些场景下,如果动态加载类过多,容易产生Perm区的OOM。比如某个实际Web工程中,因为功能点比较多,在运行过程中,要不断动态加载很多类,经常出现致命错误。Exception in thread 'dubbo client x.x connector' java.lang.OutOfMemoryError:PermGen space
    2) 而元空间和永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。
2、对永久代进行调优是很困难的。

● 方法区的垃圾收集主要回收两部分内容:常量池中废弃的常量和不再使用的类型。


8. 运行时数据区总结

1、线程私有结构:程序计数器、虚拟机栈、本地方法栈
2、每个虚拟机栈由由具体的栈帧组成,在栈帧的动态链接中,保存至对方法的引用
3、方法区在 JDK7 之前,使用永久代实现,在 JDK8 之后,使用元空间实现
4、Minor GC 针对于新生区,Major GC 针对于老年区,Full GC 针对于整个堆空间和方法区

● 面试题

1、百度
    三面:说一下JVM内存模型吧,有哪些区?分别干什么的?
2、蚂蚁金服:
    1、Java8的内存分代改进
    2、JVM内存分哪几个区,每个区的作用是什么?
    3、JVM内存分布/内存结构?栈和堆的区别?堆的结构?
    4、Eden和survior的比例分配
3、小米:
     jvm内存分区,为什么要有新生代和老年代
4、字节跳动:
     1、讲讲Jvm运行时数据区
     3、什么时候对象会进入老年代?
5、京东:
    1、JVM的内存结构,Eden和Survivor比例。
    2、JVM内存为什么要分成新生代,老年代,   持久代。新生代中为什么要分为Eden和survivor。
6、天猫:
    1、Jvm内存模型以及分区,需要详细到每个区放什么。
    2、JVM的内存模型,Java8做了什么改
7、拼多多:
    1、JVM内存分哪几个区,每个区的作用是什么?
8、美团:
    1、java内存分配
    2、jvm的永久代中会发生垃圾回收吗?
    3、jvm内存分区,为什么要有新生代和老年代?
;