您的位置:首页 > 编程语言 > Java开发

Java内存模型与线程

2015-10-11 17:15 495 查看
随着多核CPU的高速发展,为了充分利用硬件的计算资源,操作系统的并发多任务功能正变得越来越重要,但是CPU在进行计算时,还需要从内存读取输出,并将计算结果存放到内存中,然而由于CPU的运算速度比内存高几个数量级,CPU内的寄存器数量和容量有限,为了不让CPU长时间处于等待内存的空闲状态,在CPU和内存之间引入了速度接近CPU的高速缓存Cache作为CPU和内存之间的缓冲。计算机硬件并发的原理如下:



Java虚拟机对并发的支持类似于计算机硬件,java虚拟机的并发支持是通过java虚拟机的内存模型来实现的。Java虚拟机的内存模型分为主内存和工作内存,程序中所有的变量都存储在主内存中,每个线程有自己的私有工作内存,工作内存中保存了被该线程使用到的变量的主内存拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量,不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递需要通过主内存来完成。Java虚拟机并发原理如下:



Java虚拟机内存模型中定义了8种关于主内存和工作内存的交互协议操作:

(1).lock锁定:作用于主内存的变量,把一个变量标识为一条线程独占状态。

(2).unlock解锁:作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量可以被其他线程锁定。

(3).read读取:作用于主内的变量,把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。

(4).load加载:作用于工作内存的变量,把read读取操作从主内存中得到的变量值放入工作内存的变量拷贝中。

(5).use使用:作用于工作内存的变量,把工作内存中一个变量的值传递给java虚拟机执行引擎,每当虚拟机遇到一个需要使用到变量值的字节码指令时将会执行该操作。

(6).assign赋值:作用于工作内存变量,把一个从执行引擎接收到的变量的值赋值给工作变量,每当虚拟机遇到一个给变量赋值的字节码时将会执行该操作。

(7).store存储:作用于工作内存的变量,把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。

(8).write写入:作用于主内存的变量,把store操作从工作内存中得到的变量值放入主内存的变量中。

Java内存模型对上述8种操作有如下的约束:

(1).把一个变量从主内存复制到工作内存中必须顺序执行read读入操作和load载入操作。

把一个变量从工作内存同步回主内存中必须顺序执行store存储操作和write写入操作。

read和load操作之间、store和write操作之间可以插入其他指令,但是read和load操作、store和write操作必须要按顺序执行,即不允许read和load、store和write操作之一单独出现。

(2).不允许一个线程丢弃它的最近的assign赋值操作,即工作内存变量值改变之后必须同步回主内存。只有发生过assign赋值操作的变量才需要从工作内存同步回主内存。

(3).一个新变量只能在主内存中产生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,即一个变量在进行use和store操作之前,必须先执行过assgin和load操作。

(4).一个变量在同一时刻只允许一条线程对其进行lock锁定操作,但是lock锁定可以被一条线程重复执行多次,多次执行lock之后,只有执行相同次数的unlock操作变量才会被解锁。

(5).如果对一个变量执行lock锁定操作,将会清空工作内存中该变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。

(6).如果一个变量事先没有被lock锁定,则不允许对这个变量进行unlock解锁操作,也不允许对一个被别的线程锁定的变量进行unlock解锁。

(7).一个变量进行unlock解锁操作之前,必须先把此变量同步回主内存中(执行store和write操作)。

Java中的关键字volatile是java虚拟机提供的最轻量级的线程同步机制,当一个变量被声明为volatile之后,该变量将具备以下两种特性:

(1).volatile保证变量对所有线程的可见性,即任何一个线程修改了该变量的值之后,新值对于所有其他线程都是可以立即得知的。

而普通变量需要先将工作内存中的变量同步回主内存,其他线程都需要从主内存重新读取变量的值才能使用最新修改后的值。

volatile变量也可以在各个工作内存中存在不一致的情况,但由于每次使用之前都需要先刷新(工作内存变量重新执行初始化),执行引擎看不到变量不一致的情况,因此可以任务volatile变量不存在不一致的情况。

但是java中的运算并非全部都是原子操作,因此volatile变量的运行在并发下一样是线程不安全的。

由于volatile变量只能保证可见性,只有在符合如下两条规则情况才是线程安全的。

a.运算结果不依赖变量的当前值,或者能够确保只有单一线程修改变量的值。

b.变量不需要与其他其他变量共同参与不变约束。

不符合上述两条规则情况下,仍然需要通过synchronized同步关键字或者加锁机制来保证线程安全。

(2).volatile禁止指令重排序优化。

普通变量仅能保证在方法执行过程中所有依赖赋值结果的地方都能获取正确的结果,而无法保证变量赋值操作顺序与程序代码执行顺序一致。

volatile禁止指令重排序,因此volatile变量的约束如下:

a.volatile变量的操作必须按read->load->use顺序,即每次在工作内存中使用变量前必须先从主内存中刷新最新的值,以保证能看到其他线程对变量的最新修改。

b. volatile变量的操作必须按assign->store->write顺序,即每次在工作内存为变量赋值之后必须将变量的值同步回主内存,以保证让其他线程能看到变量的最新修改。

c.若线程对volatile变量A的assign或者use操作先于对volatile变量B的assign或者use操作,则线程对volatile变量A的read/load或者store/write操作也必定先于对volatile变量B的read/load或者store/write操作。

Java的并发编程是依赖虚拟机内存模型的三个特性实现的:

(1).原子性(Atomicity):

原子性是指不可再分的最小操作指令,即单条机器指令,原子性操作任意时刻只能有一个线程,因此是线程安全的。

Java内存模型中通过read、load、assign、use、store和write这6个操作保证变量的原子性操作。

long和double这两个64位长度的数据类型java虚拟机并没有强制规定他们的read、load、store和write操作的原子性,即所谓的非原子性协定,但是目前的各种商业java虚拟机都把long和double数据类型的4中非原子性协定操作实现为原子性。所以java中基本数据类型的访问读写是原子性操作。

对于大范围的原子性保证需要通过lock和unlock操作以及synchronized同步块来保证。

(2).可见性(Visibility):

可见性是指当一个线程修改了共享变量的值,其他线程可以立即得知这个修改。

Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值来实现可见性的。

Java中通过volatile、final和synchronized这三个关键字保证可见性:

volatile:通过刷新变量值确保可见性。

synchronized:同步块通过变量lock锁定前必须清空工作内存中变量值,重新从主内存中读取变量值,unlock解锁前必须把变量值同步回主内存来确保可见性。

final:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this引用传递进去,那么在其他线程中就能看见final字段的值,无需同步就可以被其他线程正确访问。

(3).有序性(Ordering):

线程的有序性是指:在线程内部,所有的操作都是有序执行的,而在线程之间,因为工作内存和主内存同步的延迟,操作是乱序执行的。

Java通过volatile和synchronized关键字确保线程之间操作的有序性。

volatile禁止指令重排序优化实现有序性。

synchronized通过一个变量在同一时刻只允许一个线程对其进行lock锁定操作来确保有序性。

JDK线程的实现如下:



(1).Kernal thread:KLT,内核线程,运行在内核态,是直接有操作系统内核支持的线程,有操作系统内核完成内核线程切换,内核操作线程调度器Threadscheduler对内核线程进行调度,负责将内核线程任务映射到各个处理器上。

(2).Light weight process: LWP,轻量级用户进程,是编程中传统意义上的线程,每个轻量级进程都由一个内核线程支持。

(3).User thread:UT,用户线程,运行在用户态,完全由用户空间线程库实现,内核线程无法感知到用户线程的实现,用户线程的创建、同步、调度和销毁完全在用户态中完成,不需要内核态的支持。

JDK的线程是基于操作系统原生线程模型来实现的,因此JDK版本中线程模型取决于java虚拟机线程与操作系统线程的映射,在不同平台上是不同的。

线程调度有两种方式:

(1).协同式:线程的执行时间由线程本身来控制,线程任务执行完成之后主动通知系统切换到另一个线程去执行。

优点:实现简单,线程切换操作对线程本身是可知的,不存在线程同步问题。

缺点:线程执行时间不可控制,如果线程长时间执行不让出CPU执行时间可能导致系统崩溃。

(2).抢占式:每个线程的执行时间有操作系统来分配,操作系统给每个线程分配执行的时间片,抢到时间片的线程执行,时间片用完之后重新抢占执行时间,线程的切换不由线程本身来决定。

优点:线程执行时间可控制,不会因为一个线程阻塞问题导致系统崩溃。

当前JDK的多线程是抢占式的多线程系统,但是可以通过设置线程优先级和改变线程的执行时间分配概率。

注意:由于JDK的线程优先级和操作系统的线程优先级不是一一对应的,因此建议只使用1(最低优先级)、5(正常优先级)和10(最高优先级)这三个优先级。

另外,线程优先级只是操作系统给线程分配执行时间的概率大小,不是绝对的。

Java中线程的状态即调度关系如下:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: