浅谈Java的内存模型以及交互,内存模型
浅谈Java的内存模型以及交互,内存模型
本文的内存模型只写虚拟机内存模型,物理机的不予描述。
Java内存模型
在Java中,虚拟机将运行时区域分成6中,如下图:
在上面的6种类型中,前三种是线程私有的,也就是说里面存放的值其他线程是看不到的,而后面三种(真正意义上讲只有堆一种)是线程之间共享的,这里面的变量对于各个线程都是可见的。如下图所示,前三种存放在线程内存中,大家都是相互独立的,而主内存可以理解为堆内存(实际上只是堆内存中的对象实例数据部分,其他例如对象头和对象的填充数据并不算入在内),为线程之间共享:
参照《深入理解Java虚拟机》
对于普通的变量来说(非volatile修饰的变量),虚拟机要求read、load有相对顺序即可,例如从主内存读取i、j两个变量,可能的操作是read i->read j->load j-> load i,并不一定是连续的。此外虚拟机还为这8种操作定制了操作的规则:
- (read,load)、(store,write)不允许出现单独的操作。也就是说这两种操作一定是以组的形式出现的,有read就有load,有store就有write,不能读取了变量值而不加载到线程内存中,也不能储存了变量值而不写到主内存中。
- 不允许线程放弃最近的assign操作。也就是说当线程使用assign操作对私有内存的变量副本进行了变更的时候,其必须使用write操作将其同步到主内存当中去。
- 不允许一个线程无原因地(没有进行assign操作)将私有内存的变量同步到主内存中。
- 变量必须从主内存产生,即不允许在私有内存中使用未初始化(未进行load或者assgin操作)的变量。也就是说,在use之前必须保证执行了load操作,在store之前必须保证执行了assign操作,例如有成员变量a和局部变量b,如果想进行a = b的操作,必须先初始化b。(一开始说了,变量指的是可以放在堆内存的变量)
- 一个变量一次只能同时允许一个线程对其进行lock操作。一个主内存的变量被一个线程使用lock操作之后,在这个线程执行unlock操作之前,其他线程不能对此变量进行操作。但是一个线程可以对一个变量进行多次锁,只要最后释放锁的次数和加锁的次数一致才能解锁。
- 当线程使用lock操作时,清除所有私有内存的变量副本。
- 使用unlock操作时,必须在此操作之前将变量同步到主内存当中。
- 不允许对没有进行lock操作的变量执行unlock操作,也不允许线程去unlock其他线程lock的变量。
改变规则的Volatile关键字
对于关键字volatile,大家都知道其一般作为并发的轻量级关键字,并且具有两个重要的语义:
但这两个语义都是因为在使用volatile关键字修饰变量的时候,内存间变量的交互规则会发生一些变化:
从上面volatile的特殊规则中,我们可以知道1、2条其实就是volatile内存可见性的语义,第三条就是禁止指令重排序的语义。另外还有其他的一些特殊规则,例如对于非volatile修饰的double或者long这两个64位的数据类型中,虚拟机允许对其当做两次32位的操作来进行,也就是说可以分解成非原子性的两个操作,但是这种可能性出现的情况也相当的小。因为Java内存模型虽然允许这样子做,但却“强烈建议”虚拟机选择实现这两种类型操作的原子性,所以平时不会出现读到“半个变量”的情况。
volatile不具备原子性
虽然volatile修饰的变量可以强制刷新内存,但是其并不具备原子性,稍加思考就可以理解,虽然其要求对变量的(read、load、use)、(assign、store、write)必须是连续出现,即以组的形式出现,但是这两组操作还是分开的。比如说,两个线程同时完成了第一组操作(read、load、use),但是还没进行第二组操作(assign、store、write),此时是没错的,然后两个线程开始第二组操作,这样最终其中一个线程的操作会被覆盖掉,导致数据的不准确。如果你觉得这是JOJO的奇妙比喻,可以看下面的代码来理解
public class TestForVolatile { public static volatile int i = 0; public static void main(String[] args) throws InterruptedException { // 创建四个线程,每个线程对i执行一定次数的自增操作 new Thread(() -> { int k = 0; while (k++ < 10000) { i++; } System.err.println("线程" + Thread.currentThread().getName() + "执行完毕"); }).start(); new Thread(() -> { int k = 0; while (k++ < 10000) { i++; } System.err.println("线程" + Thread.currentThread().getName() + "执行完毕"); }).start(); new Thread(() -> { int k = 0; while (k++ < 10000) { i++; } System.err.println("线程" + Thread.currentThread().getName() + "执行完毕"); }).start(); new Thread(() -> { int k = 0; while (k++ < 10000) { i++; } System.err.println("线程" + Thread.currentThread().getName() + "执行完毕"); }).start(); // 睡眠一定时间确保四个线程全部执行完毕 Thread.sleep(1000);
// 最终结果为33555,没有预期的4W System.out.println(i);
} }
结果图:
解释一下:因为i++操作其实为i = i + 1,假设在主内存i = 99的时候同时有两个线程完成了第一组操作(read、load、use),也就是完成了等号后面变量i的读取操作,这时候是没问题的,然后进行运算,都得出i+1=100的结果,接着对变量i进行赋值操作,这就开始第二组操作(assign、store、write),是不是同时赋值的无所谓,这样一来,两个线程都会以i = 100把值写到主内存中,也就是说,其中一个线程的操作结果会被覆盖,相当于无效操作,这就导致上面程序最终结果的不准确。
如果要保证原子性的话可以使用synchronize关键字,其可以保证原子性和内存可见性(但是不具备有禁止指令重排序的语义,这也是为什么double-check的单例模式中,实例要用volatile修饰的原因);当然你也可以使用JUC包的原子类AtomicInteger之类的。
暂时写到这里,其他关于重排序、内存屏障和happens-before原则等内容后面再进行补充。如果文章有任何不对的地方望大家指出,感激不尽!
相关文章
- 暂无相关文章
用户点评