JVM学习路线
-
请你谈谈你对JVM的理解?
-
java8虚拟机和之前的变化更新?
-
什么是OOM,什么是栈溢出StackOverFlowError?怎么分析?
-
JVM的常用调优参数有哪些?
-
内存快照如何抓取,怎么分析Dump文件?
-
谈谈JVM中,类加载器你的认识?
JVM的位置
位于操作系统之上
JVM体系结构
类加载器及双亲委派机制
从JVM理解这句话 “类是模板,对象是具体”
类加载器的种类:
-
虚拟机自带的加载器
-
启动类(根)加载器 rt BootstrpClassLoder 在java中调用不到C,C++,会打印null,因此,需要通过本地方法接口,调用本地方法库中的方法。native method().
-
扩展类加载器 ExtClassLoder
-
应用程序(系统类加载器)加载器 AppClassLoder
什么是双亲委派机制:
当某个类加载器需要加载某个.class文件时,它首先把这个任务委托给它的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才会去加载这个类。
运行过程:
-
类加载器收到类加载的请求。
-
将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器。
-
启动加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,否则,抛出异常,通知子类进行加载。
-
重复步骤3.
常出现的异常:ClassNotFound
java=c++--:去掉繁琐的东西,指针,内存管理(java交给JVM去做)。
java历史-沙箱(sandbox)安全机制
现在已经演变成为双亲委派机制。
沙箱机制就是将java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问
所有的java程序运行都可以指定沙箱,可以定制安全策略。
在java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看做是不受信任的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的java实现中,安全依赖于沙箱机制。
在jdk1.6(最新)中,引入了域的概念,虚拟机会把所有代码记载到不同的系统域和应用域。不同的域对应不一样的权限。存在于不同域的类文件就具有了当前域的全部权限。
栈溢出(StackOverFlow):无线循环,撑爆内存。
组成沙箱的基本组件:
-
类装载器(class loader):
-
它防止恶意代码去干涉善意代码;
-
它守护了被信任的类库边界;
-
他将代码归入保护域,确定了代码可以进行哪些操作;
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由java虚拟机为每一个类装载器维护的,他们之间甚至不可见。
类装载器采用的机制是双亲委派机制
-
-
字节码校验器(bytecode verifier):确保java类文件遵循java语言规范,这样可以帮助java程序实现内存保护,但并不是所有的类文件都会经过字节码校验,比如核心类。
Native、方法区
Native
-
native:凡是带了native关键字的,说明java的作用范围达不到了,会去调用底层C语言的库。
-
进入本地方法栈
-
调用本地方法本地接口 JNI(java native interface)
-
JNI作用:扩展java的使用,融合不同的编程语言为java所用,最初C、C++
-
java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
-
它在内存区域中专门开辟了一块标记区域:Native Method Stack,登记native方法
-
在最终执行的时候,加载本地方法库中的方法通过JNI
-
如:java程序驱动打印机
-
调用其他接口:scoket、webservice、http
PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向下一条指令的地址,即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可忽略不计。
方法区
method area
方法区是被所有线程共享的,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间
静态变量(static),常量(final),类信息(Class模板,构造方法,接口定义),运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关。
深入理解栈
栈:是这一种数据结构
程序=数据结构+算法
栈:先进后出,后进先出,像一个桶;
对列:先进先出(FIFO:first input first out)
喝多了吐就是栈,吃多了拉就是对列
栈:栈内存,主管程序的运行,生命周期和线程同步;线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收机制。一旦线程结束,栈就Over!
栈运行原理:栈帧; 程序正在执行的方法,一定在栈的顶部。
栈满了:StackOverFlowError;
栈+堆+方法区:交互关系;
HotSpot和堆
三种JVM
-
sun公司:HotSpot
-
BEA:JRockit
-
IBM:J9 vm
我们学习的是:HotSpot
堆:heap,一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中?类,方法,常量,变量...,保存我们所有引用类型的真实对象。
堆内存中还要细分为三个区域:
-
新生区(伊甸园区) Young/new
-
养老区 old
-
永久区 Prem
GC垃圾回收,主要是在伊甸园和养老区。
假设内存满了,OOM,堆内存不够!java.lang.OutOfMemoryError:java heap space
新生区、永久区
新生区
-
类:诞生和成长的地方,甚至死亡;
-
伊甸园,所有的对象都是在伊甸园区new出来的;
-
幸存区(0,1)
真理:经过研究,99%的对象都是临时对象。
永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象,Interface元数据,存储的时java运行时的一些环境或类信息。这个区域不存在垃圾回收,关闭VM虚拟机就会释放这个区域的内存。
一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载,知道内存满了,就会出现OOM。
-
jdk1.6之前:永久代,常量池是在方法区。
-
jdk1.7 :永久代,但是慢慢退化了,去永久代,常量池在堆中。
-
jdk1.8之后:无永久代,常量池在元空间。
默认的情况下:分配的总内存是电脑内存的1/4,而初始化内的内存:1/64.
出现OOM错误,解决方法:
-
尝试扩大堆内存看结果。
-
分析内存,看一下哪个地方出现了问题(借助专业工具)。
使用Jpofiler、MAT工具分析OOM原因
在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错?
-
能够看到代码第几行出错:内存快照分析工具,MAT、jprofiler
-
Dubug,一行行分析代码
MAT、jprofiler作用:
-
分析Dump内存文件,快速定位内存泄露;
-
获得堆中的数据;
-
获得大的对象;
-
...
-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
-Xms 设置初始化内存分配大小 1/64;
-Xmx 设置最大分配内存,默认1/4;
-XX:PrintGCDetails 打印GC垃圾回收信息;
-XX:+HeapDumpOnOutOfMemoryError oom dump;
GC介绍
JVM在进行GC时,并不是对这三个区域统一回收,大部分时候,回收都是新生代。
-
新生区
-
幸存区(from,to)
-
老年区
GC两种类:轻GC(普通的GC),重GC(全局GC);
GC面试题目:
-
JVM的内存模型和分区,详细到每个区放什么?
-
堆里面的分区有哪些?Eden,from,to,老年区,说说他们的特点?
-
GC的算法有哪些?引用计数器、标记清除法、标记压缩、复制算法、怎么用的?
-
轻GC和重GC分别在什么时候发生?
引用计数法
复制法
-
好处:没有内存碎片;
-
坏处:浪费了内存空间,多了一半空间永远是空to。假设对象100%存活(极端情况);
复制算法最佳使用场景:对象存活度较低的时候,在新生区。
标记清除
-
优点:不需要额外的空间;
-
缺点:两次扫描,严重浪费时间,会产生内存碎片;
标记清除压缩
改良:先进行五次标记清除算法,然后再进行一次标记清除压缩算法。
GC算法总结:
内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法=标记清除算法>复制算法
难道没有最优算法吗?
没有,没有最好的算法,只有最合适的算法——>GC:分代收集算法
年轻代:
-
存活率低
-
复制算法
老年代:
-
区域大:存活率高
-
标记清除(内存碎片不是很多)+标记压缩混合实现(调优:几次压缩一次)
一天时间学JVM,不现实,要深究,必须花时间,多看面试题,以及《深入理解JVM》,最重要的时掌握一个学习JVM的方法。
JMM
-
什么是JMM?
JMM:java Memory Model的缩写(java内存模型)
注意:java内存模型和JVM内存模型不是一个概念。
-
它是干嘛的?官方,其他人的博客,对应的视频
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)。
JMM定义了线程工作内存和主存之间的抽象关系:线程之间的共享变量存储在主内存(main memory)中,每个线程都有一个私有的本地内存(local memory)。
解决共享对象可见性这个问题:volilate;
-
它将如何学习?
JMM:抽象的概念,理论
MM的八种交互操作(每个操作都为原子操作)
lock (锁定):作用于主内存的变量,把一个变量标识为线程独占状态 unlock (解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定 read (读取):作用于主内存变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用 load (载入):作用于工作内存的变量,它把read操作从主存中变量放入工作内存中 use (使用):作用于工作内存中的变量,它把工作内存中的变量传输给执行引擎,每当虚拟机遇到一个需要使用到变量的值,就会使用到这个指令 assign (赋值):作用于工作内存中的变量,它把一个从执行引擎中接受到的值放入工作内存的变量副本中 store (存储):作用于主内存中的变量,它把一个从工作内存中一个变量的值传送到主内存中,以便后续的write使用 write (写入):作用于主内存中的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中
对八种操作的规则:
-
不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
-
不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
-
不允许一个线程将没有assign的数据从工作内存同步回主内存
-
一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是怼变量实施use、store操作之前,必须经过assign和load操作
-
一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
-
如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
-
如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
-
对一个变量进行unlock操作之前,必须把此变量同步回主内存
-
volilate
volilate原理:Java语言提供了一种稍弱的同步机制,即volatile变量,用来确保将变量的更新操作通知到其他线程。当把变量声明为volatile类型后,编译器与运行时都会注意到这个变量是共享的,因此不会将该变量上的操作与其他内存操作一起重排序。volatile变量不会被缓存在寄存器或者对其他处理器不可见的地方,因此在读取volatile类型的变量时总会返回最新写入的值。
在访问volatile变量时不会执行加锁操作,因此也就不会使执行线程阻塞,因此volatile变量是一种比sychronized关键字更轻量级的同步机制。
当对非 volatile 变量进行读写的时候,每个线程先从内存拷贝变量到CPU缓存中。如果计算机有多个CPU,每个线程可能在不同的CPU上被处理,这意味着每个线程可以拷贝到不同的 CPU cache 中。
而声明变量是 volatile 的,JVM 保证了每次读变量都从内存中读,跳过 CPU cache 这一步。
当一个变量定义为 volatile 之后,将具备两种特性:
1.保证此变量对所有的线程的可见性,这里的“可见性”,如本文开头所述,当一个线程修改了这个变量的值,volatile 保证了新值能立即同步到主内存,以及每次使用前立即从主内存刷新。但普通变量做不到这点,普通变量的值在线程间传递均需要通过主内存(详见:
2.禁止指令重排序优化。有volatile修饰的变量,赋值后多执行了一个“load addl $0x0, (%esp)”操作,这个操作相当于一个内存屏障(指令重排序时不能把后面的指令重排序到内存屏障之前的位置),只有一个CPU访问内存时,并不需要内存屏障;(什么是指令重排序:是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理)。
volatile 性能:
volatile 的读性能消耗与普通变量几乎相同,但是写操作稍慢,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。