多任務處理在現代計算機操作系統中幾乎已是一項必備的功能了。在許多情況下,讓計算機同時去做幾件事情,不僅是因為計算機的運算能力強大了,還有一個很重要的原因是計算機的運算速度與它的存儲和通信子系統速度的差距太大,大量的時間都花費在磁盤I/O、網絡通信或者數據庫訪問上。如果不希望處理器在大部分時間裡都處於等待其他資源的狀態,就必須使用一些手段去把處理器的運算能力“壓榨”出來,否則就會造成很大的浪費,而讓計算機同時處理幾項任務則是最容易想到、也被證明是非常有效的“壓榨”手段
關於可見性
在多核多線程環境中,為了提升運行時數據訪問性能,經常會使用多層緩存策略。這種架構也就帶來了共享變量可見性問題,每個核或線程都有自己的本地副本,對於共享變量的讀寫操作可能不會被其它核或線程知曉,也就是不可見了。
## Java內存模型
Java的世界也有屬於它自己的內存模型,Java內存模型(Java Memory Model),簡稱JMM。由於Java被定義成一種跨平臺的語言,所以在內存的描述上面也要能是跨平臺的,Java虛擬機試圖定義一種統一的內存模型,能將各種底層硬件及操作系統的內存訪問差異進行封裝,使Java程序在不同硬件及操作系統上都能達到相同的併發效果。它描述了程序中各個變量之間的關係,包括實例域、靜態域、數據元素及在實際計算機系統中將變量存儲到內存和從內存中取出變量的底層細節。
為更好理解JMM的工作機制,我們通過下圖進行理解。從整體上看有幾個比較重要的概念:主內存、工作(本地)內存、共享變量、共享變量副本、線程等。首先看主內存與工作內存及他們的關係,主內存保存了Java程序的所有變量,當然這個變量不包括局部變量和方法參數。工作內存則包含了這些共享變量的副本。其次是線程與工作內存的關係,每個線程都有一個屬於自己的工作內存,不同線程之間的工作內存是互相不可見的,且線程對變量的操作也只能是針對自己的工作內存。最後是關於線程之間的通信機制,線程之間不可直接傳遞。假如某個線程對一個變量進行了重新賦值,那麼該如何讓另一個條線程知道呢?線程A將變量改變反應到主存中,線程B再從主存中讀取,這樣才能完成線程之間的通信。
JMM主要操作
JMM定義了八個主要的內存操作來完成工作內存與主存的通信。假如一條線程準備對一個變量進行新的賦值操作,它可能會先用lock操作鎖住主內存中的某個變量,不讓其他線程獲得此變量的鎖,直至使用unlock操作釋放該變量的鎖。接著使用read操作將變量從主存讀到工作內存中,緊接著load操作將得到的變量值放到工作內存中的變量副本。use操作則將變量值傳給線程執行引擎進行運算操作,assign操作把新的變量值從線程執行引擎中傳遞到工作內存。store操作則把變量值從工作內存傳送到主存中,接著write操作將得到的值寫入主存相應的變量中,最後使用unlock操作釋放變量的鎖。
### JMM可見性
在Java內存模型中,如果一個線程更改了共享變量的值,其他線程能馬上知道這個更改,則我們說這個變量具有可見性。一般來說有四種方式能保證變量的可見性,分別為volatile、synchronized、final和鎖。
首先談談volatile,被此關鍵詞聲明的變量,每當有任何更改時都將立即同步到主存中,而每個線程要使用這個變量時都要重新從主存刷新到工作內存,這樣就確保了變量的可見性。當然,普通變量最終也會同步到主存,再由主存同步到每個線程的工作內存,只是這個最終可能比較“長久”,不能保證可見性。
其次,關於synchronized,由於synchronized底層也是通過鎖進行實現,所以synchronized和鎖的本質是一樣的。當一個線程釋放一個鎖時,將會強制刷新工作內存中的變量值到主存中。而當另一個線程獲取此鎖的時候將會強制重新裝載此變量值。當然這兩個線程獲取的是同一個鎖,這樣就保證了變量的可見性。
最後,被final聲明的變量一旦完成初始化,其他線程就能看到這個final變量。其實,可見性其實可以看成是一種機制,線程在進入/退出同步塊程序時,它將發送/接收一個變量的更改。
JMM有序性
有序性指在線程內看方法的執行,所有的指令都是有序的,都按照一種串行方式執行。而在線程內觀察其他線程,所有指令都是無序的,指令都可能交叉執行。Java中提供了volatile和synchronized兩個關鍵詞保證線程之間操作的有序性,而這個有序性僅僅是相對的,volatile禁止指令重排序,synchronized則保證持有同一個鎖的同步塊只能串行運行。
JMM原子性
Java內存模型保證了read、load、assign、use、store、write等操作具有原子性,我們可以認為除了long和double類型外,對其他基本數據類型所對應的內存單元的訪問讀寫都是原子的。但由於這個原子性的顆粒度太小,通常情況下我們需要更大顆粒度的原子性,這時就需要用鎖來保證了。
## 總結
JMM可以說是Java的基礎,也是Java多線程的基礎,它的定義將直接影響JVM及Java多線程實現的機制。要想深入瞭解多線程併發中的相關問題現象,對Java內存模型的深入研究是必不可少的。它的定義必須考慮下面幾個方面,其一是如何更加有效地提高線程的性能效率;其二是如何將底層物理硬件及操作系統的差異屏蔽掉提供統一的對外概念;最後是如何使它的模型既嚴謹又寬鬆,保證語義不會產生歧義和一些優化擴展。