volatile與happens-before的關(guān)系與內(nèi)存一致性錯誤
volatile變量
volatile是Java的關(guān)鍵詞,我們可以用它來修飾變量或者方法。
為什么要使用volatile
volatile的典型用法是,當(dāng)多個線程共享變量,且我們要避免由于內(nèi)存緩沖變量導(dǎo)致的內(nèi)存一致性(Memory Consistency Errors)錯誤時。
考慮以下的生產(chǎn)者消費者例子,在一個時刻我們生產(chǎn)或消費一個單位。
public class ProducerConsumer { private String value = ""; private boolean hasValue = false; public void produce(String value) { while (hasValue) { try { Thread.sleep(500); } catch (InterruptedException e) { e.printStackTrace(); } } System.out.println("Producing " + value + " as the next consumable"); this.value = value; hasValue = true; } public String consume() { while (!hasValue) { try { Thread.sleep(500); } catch (InterruptedException e) { e.printStackTrace(); } } String value = this.value; hasValue = false; System.out.println("Consumed " + value); return value; } }
在這個例子中,produce方法產(chǎn)生一個新的值,并保存在value變量中,并且將hasValue標(biāo)志位置為true。while循環(huán)檢查hasValue是否為true,為true則標(biāo)志產(chǎn)生的數(shù)據(jù)還沒有被消費,如果為true,則休眠當(dāng)前線程。當(dāng)hasValue置為false的時候,休眠循環(huán)才會停止,也就是將數(shù)據(jù)被consume方法消費后。如果沒有可用的數(shù)據(jù),cosume方法會休眠。當(dāng)produce方法產(chǎn)生一個新的數(shù)據(jù)后,consume會結(jié)束休眠,消費該數(shù)據(jù),并清除hasValue標(biāo)志位。
現(xiàn)在設(shè)想兩個線程使用該類的同一個對象——一個用來產(chǎn)生數(shù)據(jù)(write線程),另一個用來消耗數(shù)據(jù)(read線程)。實例代碼如下,
public class ProducerConsumerTest { @Test public void testProduceConsume() throws InterruptedException { ProducerConsumer producerConsumer = new ProducerConsumer(); List<String> values = Arrays.asList("1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13"); Thread writerThread = new Thread(() -> values.stream() .forEach(producerConsumer::produce)); Thread readerThread = new Thread(() -> { for (int i = 0; i > values.size(); i++) { producerConsumer.consume(); } }); writerThread.start(); readerThread.start(); writerThread.join(); readerThread.join(); } }
在大多數(shù)情況下,該例子會輸出預(yù)期的結(jié)果,但是也有很大的可能進(jìn)入死鎖狀態(tài)!
為什么會發(fā)生該現(xiàn)象?
首先我們介紹一點計算機(jī)架構(gòu)的知識。
我們知道計算機(jī)包括了CPU和內(nèi)存單元(還有其他組件)。程序指令和變量處在的內(nèi)存成為主內(nèi)存;在程序執(zhí)行期間,為了更好的性能,CPU可能會在其內(nèi)部內(nèi)存(也就是CPU緩沖)中存放變量的拷貝。由于現(xiàn)在計算機(jī)包括了不止一個CPU,所以同時也包括了多個CPU緩沖。
在多線程環(huán)境中,多個線程有可能在同一個時間運行,每個在不同的CPU(由底層OS決定),并且他們可能從主內(nèi)存中復(fù)制變量到對應(yīng)的CPU緩沖中。當(dāng)線程訪問這些變量時,其訪問的是這些緩沖的變量,并不是位于主內(nèi)存的實際變量。
現(xiàn)在我們假設(shè)上個例子中的兩個線程運行在兩個不同的CPU上,并且hasValue變量被緩沖在其中一個CPU上(或者兩個)??紤]以下的執(zhí)行序列:
1.writer線程產(chǎn)生一個數(shù)據(jù),并將hasValue設(shè)置為true。然而,這個改變只是體現(xiàn)在CPU緩沖上,而不是主內(nèi)存。
2.reader線程準(zhǔn)備消耗一個數(shù)據(jù),但是其CPU緩沖的hasValue為false。所以即使writer線程產(chǎn)生了一個數(shù)據(jù),reader線程也不能消耗該數(shù)據(jù)。
3.由于reader線程無法消費新產(chǎn)生的數(shù)據(jù),writer線程也不能繼續(xù)產(chǎn)生新的數(shù)據(jù)(由于hasValue為true),因此writer會休眠。
4.然后就出現(xiàn)了死鎖!
當(dāng)hasValue值在所有的緩沖中都同步(基于底層OS),該情形就會改變。
解決方案?volatile如何適用該例子?
如果我們將hasValue設(shè)置為volatile,那么我們可以保證這種類型的死鎖不會出現(xiàn)。
private volatile boolean hasValue = false;
將一個變量設(shè)置為volatile后,線程就會直接從主內(nèi)存中讀取該變量的值,并且該變量的寫入會立即刷新到主內(nèi)存中。如果一個線程緩沖了該變量,那么每次讀和寫操作都會和主內(nèi)存同步。
這個修改后,考慮上面那個可能會導(dǎo)致死鎖的步驟:
1.writer產(chǎn)生了一個新的數(shù)據(jù),并將hasValue設(shè)置為true。該更新會直接反映在主內(nèi)存中(即使該線程使用了緩存)。
2.reader線程嘗試消費一個變量,并檢查hasValue的值。該變量的每次讀都會直接從主內(nèi)存獲得,所以它能獲得到writer線程導(dǎo)致的改變。
3.reader線程消費該變量并清楚hasValue標(biāo)志位。該變量會刷新到主內(nèi)存中(如果被緩存,則緩存的變量也會刷新)。
4.由于reader線程每次都操作的主內(nèi)存,所以writer線程能看到reader導(dǎo)致的改變。其會繼續(xù)產(chǎn)生新的數(shù)據(jù)。
volatile與happens-before關(guān)系
訪問volatile變量在語句間建立了happens-before關(guān)系。當(dāng)寫入一個volatile變量時,它與之后的該變量的讀操作建立了happens-before關(guān)系。那么什么是happens-before關(guān)系呢?可以參考筆者之前的博客[Java并發(fā)編程番外篇(二)happens-before關(guān)系],簡單來說,就是保證一個語句的影響會被另一個語句看到(http://chabaoo.cn/article/161649.htm)。
考慮以下的例子,
// Definition: Some variables private int first = 1; private int second = 2; private int third = 3; private volatile boolean hasValue = false; // First Snippet: A sequence of write operations being executed by Thread 1 first = 5; second = 6; third = 7; hasValue = true; // Second Snippet: A sequence of read operations being executed by Thread 2 System.out.println("Flag is set to : " + hasValue); System.out.println("First: " + first); // will print 5 System.out.println("Second: " + second); // will print 6 System.out.println("Third: " + third); // will print 7
我們假設(shè)兩面的兩個片段運行在兩個線程——線程1和線程2. 當(dāng)線程1修改hasValue值后,不僅僅hasValue的值會直接寫入到主內(nèi)存,前面的三個寫操作也會寫入主內(nèi)存(和之前的其他寫操作)。因此,當(dāng)線程2訪問這三個變量時,它會看到線程1對這些變量進(jìn)行的修改,即使他們會緩存(這些緩存也會被更新)。
這也正是在第一個例子中,我們沒有將value變量設(shè)置為volatile的原因。這是由于訪問hasValue之前其他變量的寫操作,和讀hashValue之后其他變量的讀操作,會自動和主內(nèi)存同步。
這是另外一個有趣的序列。JVM以它的程序優(yōu)化著名。有時候,在不影響輸出的情況下,JVM會對指令進(jìn)行重排序來獲得更好的性能。作為例子,它可能將該序列的代碼,
first = 5; second = 6; third = 7;
重排序為,
first = 5; second = 6; third = 7;然而,當(dāng)一個語句涉及到訪問volatile變量,那么JVM就不會將一個volatile寫操作之前的語句放到volatile寫操作之后。也就是說,它不會將以下的代碼序列,
first = 5; // write before volatile write second = 6; // write before volatile write third = 7; // write before volatile write hasValue = true;
修改成,
first = 5; second = 6; hasValue = true; third = 7; // Order changed to appear after volatile write! This will never happen!即使從代碼正確性的角度來看,這兩者是相同的。注意到JVM仍然允許重排序前三條語句,只要他們位于volatile寫之前。
類似,JVM不會將位于volatile讀之后的代碼重排序到volatile讀之前。也就是說該代碼,
System.out.println("Flag is set to : " + hasValue); // volatile read System.out.println("First: " + first); // Read after volatile read System.out.println("Second: " + second); // Read after volatile read System.out.println("Third: " + third); // Read after volatile read
并不會修改為,
http://System.out.println("First: " + first); // Read before volatile read! Will never happen! System.out.println("Fiag is set to : " + hasValue); // volatile read System.out.println("Second: " + second); System.out.println("Third: " + third);
然而,JVM可以將后三條語句重排序,只要他們在volatile讀之后。
volatile帶來的性能開銷
volatile強(qiáng)制進(jìn)行主內(nèi)存訪問,而主內(nèi)存訪問通常比CPU緩存訪問慢。同時也阻止了JVM進(jìn)行的一些程序優(yōu)化,更進(jìn)一步降低了性能。
能否使用volatile來保證多線程的數(shù)據(jù)一致性?
答案是不能。當(dāng)多個線程訪問同一個變量時,將該變量標(biāo)志為volatile并不足以保證一致性,考慮下面的UnsafeCounter類,
public class UnsafeCounter { private volatile int counter; public void inc() { counter++; } public void dec() { counter--; } public int get() { return counter; } }
測試代碼,
public class UnsafeCounter { private volatile int counter; public void inc() { counter++; } public void dec() { counter--; } public int get() { return counter; } }
代碼很容易讀懂。我們在一個線程中增加計數(shù)器的值,然后在另一個線程中減少計數(shù)器的值。運行這個測試,我們預(yù)期的計數(shù)器的結(jié)果是0,但是這并不能保證。大多數(shù)情況下都是0,然而,一些情況下,可能是-2,-1,1,2,甚至[-5,5]的任何數(shù)字。
為什么會發(fā)生這種情況呢?這是由于counter變量的增加和減少操作都不是原子操作——他們不是一次執(zhí)行完畢的。他們都包括了多個步驟,而且兩個步驟序列有交疊。你可以認(rèn)為自增這樣操作:
1.讀取counter數(shù)值
2.增加1
3.將數(shù)值寫入到counter中
同樣的,自減操作:
1.讀取counter數(shù)值
2.減少1
3.將數(shù)值寫入到counter中
現(xiàn)在,我們考慮以下的執(zhí)行序列:
1.第一個線程從內(nèi)存中讀取counter的值。其被初始化為0. 然后該線程將其自增.
2.第二個線程同時也從內(nèi)存中讀取counter的值,并且該值也為0. 然后該線程對其執(zhí)行自減操作。
3.第一個進(jìn)程將數(shù)值寫入到內(nèi)存中,即,counter的值為1.
4.第二個線程將數(shù)值寫入到內(nèi)存中,即,counter的值為-1.
5.第一個線程的更新被丟失。
怎么阻止該現(xiàn)象呢?
1. 使用同步:
public class SynchronizedCounter { private int counter; public synchronized void inc() { counter++; } public synchronized void dec() { counter--; } public synchronized int get() { return counter; } }
2. 或者使用AtomicInteger:
public class AtomicCounter { private AtomicInteger atomicInteger = new AtomicInteger(); public void inc() { atomicInteger.incrementAndGet(); } public void dec() { atomicInteger.decrementAndGet(); } public int get() { return atomicInteger.intValue(); }
我的選擇是使用AtomicInteger,因為同步方法只允許一個線程訪問inc/dec/get方法,這帶來了額外的性能開銷。
使用同步方法時,我們并沒有將counter設(shè)置為volatile變量。這是因為,使用synchronized關(guān)鍵詞就建立了happens-before關(guān)系。進(jìn)入一個同步方法(代碼塊),在該語句之前的代碼和方法(代碼塊)中的代碼建立了happens-before關(guān)系。淺談Java內(nèi)存模型之happens-before可以查看詳細(xì)介紹。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
詳解使用spring cloud config來統(tǒng)一管理配置文件
這篇文章主要介紹了詳解使用spring cloud config來統(tǒng)一管理配置文件,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-12-12SpringBoot使用MyBatis-Flex實現(xiàn)靈活的數(shù)據(jù)庫訪問
MyBatisFlex是一款優(yōu)秀的持久層框架,本文主要介紹了SpringBoot使用MyBatis-Flex實現(xiàn)靈活的數(shù)據(jù)庫訪問,具有一定的參考價值,感興趣的可以了解一下2024-06-06使用@Autowired注解引入server服務(wù)層方法時報錯的解決
這篇文章主要介紹了使用@Autowired注解引入server服務(wù)層方法時報錯的解決,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-11-11使用Flyway進(jìn)行Java數(shù)據(jù)庫版本控制的操作指南
今天我們將深入探討如何使用Flyway進(jìn)行Java數(shù)據(jù)庫版本控制,Flyway是一個流行的數(shù)據(jù)庫遷移工具,用于管理和自動化數(shù)據(jù)庫模式的演變,文中通過代碼示例介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2024-07-07springboot2.X整合prometheus監(jiān)控的實例講解
這篇文章主要介紹了springboot2.X整合prometheus監(jiān)控的實例講解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03java中關(guān)于文本文件的讀寫方法實例總結(jié)
這篇文章主要介紹了java中關(guān)于文本文件的讀寫方法,實例總結(jié)了Java針對文本文件讀寫的幾種常用方法,并對比了各個方法的優(yōu)劣及特點,具有一定參考借鑒價值,需要的朋友可以參考下2015-11-11