一篇帶你解析入門LongAdder源碼
1、LongAdder由來(lái)
LongAdder
類是JDK1.8新增的一個(gè)原子性操作類。AtomicLon
g通過(guò)CAS算法提供了非阻塞的原子性操作,相比受用阻塞算法的同步器來(lái)說(shuō)性能已經(jīng)很好了,但是JDK開發(fā)組并不滿足于此,因?yàn)榻?jīng)常搞并發(fā)的請(qǐng)求下AtomicLong
的性能是不能讓人接受的。
如下AtomicLong
的incrementAndGet
的代碼,雖然AtomicLong
使用CAS算法,但是CAS失敗后還是通過(guò)無(wú)限循環(huán)的自旋鎖不多的嘗試,這就是高并發(fā)下CAS性能低下的原因所在。源碼如下:
public final long incrementAndGet() { for (;;) { long current = get(); long next = current + 1; if (compareAndSet(current, next)) return next; } }
高并發(fā)下N多線程同時(shí)去操作一個(gè)變量會(huì)造成大量線程CAS失敗,然后處于自旋狀態(tài),導(dǎo)致嚴(yán)重浪費(fèi)CPU資源,降低了并發(fā)性。
2、LongAdder與AtomicLong的簡(jiǎn)單介紹
我們知道,volatile
關(guān)鍵字是輕量級(jí)鎖,可以解決多線程內(nèi)存不可見問(wèn)題。對(duì)于一寫多讀,可以解決變量同步問(wèn)題,但是如果是多寫,volatile
無(wú)法解決線程安全問(wèn)題的。例如,count++操作,就應(yīng)該使用如下方式: AtomicInteger count = new AtomicInteger();
、count.addAndGet(1);
而如果是JDK8及以上,推薦使用LongAdder對(duì)象替代,因?yàn)樗男阅鼙?code>AtomicLong 更好(減少樂(lè)觀鎖的重試次數(shù))。
LongAdder其他應(yīng)用場(chǎng)景:
對(duì)于Java項(xiàng)目
中計(jì)數(shù)統(tǒng)計(jì)的一些需求,如果是 JDK8,推薦使用 LongAdder 對(duì)象,比 AtomicLong 性能更好(減少樂(lè)觀鎖的重試次數(shù))
在大多數(shù)項(xiàng)目及開源組件中,計(jì)數(shù)統(tǒng)計(jì)使用最多的仍然還是AtomicLong
,雖然是阿里巴巴這樣說(shuō),但是我們?nèi)匀灰鶕?jù)使用場(chǎng)景來(lái)決定是否使用LongAdder
。
今天主要是來(lái)講講LongAdder
的實(shí)現(xiàn)原理,還是老方式,通過(guò)圖文一步步解開LongAdder
神秘的面紗,通過(guò)此篇文章你會(huì)了解到:
- 為什么AtomicLong在高并發(fā)場(chǎng)景下性能急劇下降?
- LongAdder為什么快?
- LongAdder實(shí)現(xiàn)原理(圖文分析)
- AtomicLong是否可以被遺棄或替換?
本文代碼全部基于JDK 1.8,建議邊看文章邊看源碼更加利于消化!
3、AtomicLong
當(dāng)我們?cè)谶M(jìn)行計(jì)數(shù)統(tǒng)計(jì)的時(shí),通常會(huì)使用AtomicLong
來(lái)實(shí)現(xiàn)。AtomicLong
能保證并發(fā)情況下計(jì)數(shù)的準(zhǔn)確性,其內(nèi)部通過(guò)CAS來(lái)解決并發(fā)安全性的問(wèn)題。
3.1 AtomicLong實(shí)現(xiàn)原理
說(shuō)到線程安全的計(jì)數(shù)統(tǒng)計(jì)工具類,肯定少不了Atomic
下的幾個(gè)原子類。AtomicLong
就是juc包下重要的原子類,在并發(fā)情況下可以對(duì)長(zhǎng)整形類型數(shù)據(jù)進(jìn)行原子操作,保證并發(fā)情況下數(shù)據(jù)的安全性。
public class AtomicLong extends Number implements java.io.Serializable { // + 1 public final long incrementAndGet() { return unsafe.getAndAddLong(this, valueOffset, 1L) + 1L; } // - 1 public final long decrementAndGet() { return unsafe.getAndAddLong(this, valueOffset, -1L) - 1L; } }
我們?cè)谟?jì)數(shù)的過(guò)程中,一般使用incrementAndGet()
和decrementAndGet()
進(jìn)行加一和減一操作,這里調(diào)用了Unsafe
類中的getAndAddLong()
方法進(jìn)行操作。
接著看看unsafe.getAndAddLong()方法:
public final class Unsafe { public final long getAndAddLong(Object var1, long var2, long var4) { long var6; do { var6 = this.getLongVolatile(var1, var2); } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4)); return var6; } public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6); }
這里直接進(jìn)行CAS+自旋操作更新AtomicLong
中的value
值,進(jìn)而保證value
值的原子性更新。
3.2 AtomicLong瓶頸分析
如上代碼所示,我們?cè)谑褂肅AS + 自旋的過(guò)程中,在高并發(fā)環(huán)境下,N個(gè)線程同時(shí)進(jìn)行自旋操作,會(huì)出現(xiàn)大量失敗并不斷自旋的情況,此時(shí)AtomicLong
的自旋會(huì)成為瓶頸。
如上圖所示,高并發(fā)場(chǎng)景下AtomicLong
性能會(huì)急劇下降,我們后面也會(huì)舉例說(shuō)明。
那么高并發(fā)下計(jì)數(shù)的需求有沒(méi)有更好的替代方案呢?在JDK8
中 Doug Lea
大神新寫了一個(gè)LongAdder
來(lái)解決此問(wèn)題,我們后面來(lái)看LongAdder
是如何優(yōu)化的。
4、LongAdder
4.1 LongAdder和AtomicLong性能測(cè)試
我們說(shuō)了很多LongAdder上性能優(yōu)于AtomicLong,到底是不是呢?一切還是以代碼說(shuō)話:
/** * Atomic和LongAdder耗時(shí)測(cè)試 */ public class AtomicLongAdderTest { public static void main(String[] args) throws Exception{ testAtomicLongAdder(1, 10000000); testAtomicLongAdder(10, 10000000); testAtomicLongAdder(100, 10000000); } static void testAtomicLongAdder(int threadCount, int times) throws Exception{ System.out.println("threadCount: " + threadCount + ", times: " + times); long start = System.currentTimeMillis(); testLongAdder(threadCount, times); System.out.println("LongAdder 耗時(shí):" + (System.currentTimeMillis() - start) + "ms"); System.out.println("threadCount: " + threadCount + ", times: " + times); long atomicStart = System.currentTimeMillis(); testAtomicLong(threadCount, times); System.out.println("AtomicLong 耗時(shí):" + (System.currentTimeMillis() - atomicStart) + "ms"); System.out.println("----------------------------------------"); } static void testAtomicLong(int threadCount, int times) throws Exception{ AtomicLong atomicLong = new AtomicLong(); List<Thread> list = Lists.newArrayList(); for (int i = 0; i < threadCount; i++) { list.add(new Thread(() -> { for (int j = 0; j < times; j++) { atomicLong.incrementAndGet(); } })); } for (Thread thread : list) { thread.start(); } for (Thread thread : list) { thread.join(); } System.out.println("AtomicLong value is : " + atomicLong.get()); } static void testLongAdder(int threadCount, int times) throws Exception{ LongAdder longAdder = new LongAdder(); List<Thread> list = Lists.newArrayList(); for (int i = 0; i < threadCount; i++) { list.add(new Thread(() -> { for (int j = 0; j < times; j++) { longAdder.increment(); } })); } for (Thread thread : list) { thread.start(); } for (Thread thread : list) { thread.join(); } System.out.println("LongAdder value is : " + longAdder.longValue()); } }
執(zhí)行結(jié)果:
這里可以看到隨著并發(fā)的增加,AtomicLong
性能是急劇下降的,耗時(shí)是LongAdder
的數(shù)倍。至于原因我們還是接著往后看。
4.2 LongAdder為什么這么快
先看下LongAdder
的操作原理圖:
既然說(shuō)到LongAdder
可以顯著提升高并發(fā)環(huán)境下的性能,那么它是如何做到的?
1、 設(shè)計(jì)思想上,LongAdder
采用"分段"的方式降低CAS失敗的頻次
這里先簡(jiǎn)單的說(shuō)下LongAdder
的思路,后面還會(huì)詳述LongAdder
的原理。
我們知道,AtomicLong中有個(gè)內(nèi)部變量value保存著實(shí)際的long值,所有的操作都是針對(duì)該變量進(jìn)行。也就是說(shuō),高并發(fā)環(huán)境下,value
變量其實(shí)是一個(gè)熱點(diǎn)數(shù)據(jù),也就是N個(gè)線程競(jìng)爭(zhēng)一個(gè)熱點(diǎn)。
LongAdder
的基本思路就是分散熱點(diǎn),將value
值的新增操作分散到一個(gè)數(shù)組中,不同線程會(huì)命中到數(shù)組的不同槽中,各個(gè)線程只對(duì)自己槽中的那個(gè)value
值進(jìn)行CAS操作,這樣熱點(diǎn)就被分散了,沖突的概率就小很多。
LongAdde
r有一個(gè)全局變量volatile long base
值,當(dāng)并發(fā)不高的情況下都是通過(guò)CAS來(lái)直接操作base值,如果CAS失敗,則針對(duì)LongAdder
中的Cell[]
數(shù)組中的Cell進(jìn)行CAS操作,減少失敗的概率。
例如當(dāng)前類中base = 10
,有三個(gè)線程進(jìn)行CAS
原子性的**+1操作**,線程一執(zhí)行成功,此時(shí)base=11,線程二、線程三執(zhí)行失敗后開始針對(duì)于Cell[]
數(shù)組中的Cell
元素進(jìn)行**+1操作**,同樣也是CAS
操作,此時(shí)數(shù)組index=1
和index=2
中Cell
的value
都被設(shè)置為了1.
執(zhí)行完成后,統(tǒng)計(jì)累加數(shù)據(jù):sum = 11 + 1 + 1 = 13,利用LongAdder進(jìn)行累加的操作就執(zhí)行完了,流程圖如下:
如果要獲取真正的long
值,只要將各個(gè)槽中的變量值累加返回。這種分段的做法類似于JDK7中ConcurrentHashMap
的分段鎖。
2、使用Contended注解來(lái)消除偽共享
在 LongAdder
的父類 Striped64
中存在一個(gè) volatile Cell[] cells;
數(shù)組,其長(zhǎng)度是2 的冪次方,每個(gè)Cell
都使用 @Contended
注解進(jìn)行修飾,而@Contended
注解可以進(jìn)行緩存行填充,從而解決偽共享問(wèn)題。偽共享會(huì)導(dǎo)致緩存行失效,緩存一致性開銷變大。
@sun.misc.Contended static final class Cell { }
偽共享指的是多個(gè)線程同時(shí)讀寫同一個(gè)緩存行的不同變量時(shí)導(dǎo)致的 CPU緩存失效
。盡管這些變量之間沒(méi)有任何關(guān)系,但由于在主內(nèi)存中鄰近,存在于同一個(gè)緩存行之中,它們的相互覆蓋會(huì)導(dǎo)致頻繁的緩存未命中,引發(fā)性能下降。這里對(duì)于偽共享我只是提一下概念,并不會(huì)深入去講解,大家可以自行查閱一些資料。
解決偽共享的方法一般都是使用直接填充,我們只需要保證不同線程的變量存在于不同的 CacheLine
即可,使用多余的字節(jié)來(lái)填充可以做點(diǎn)這一點(diǎn),這樣就不會(huì)出現(xiàn)偽共享問(wèn)題。例如在Disruptor
隊(duì)列的設(shè)計(jì)中就有類似設(shè)計(jì)。
在Striped64
類中我們可以看看Doug Lea
在Cell
上加的注釋也有說(shuō)明這一點(diǎn):
框中的翻譯如下:
Cell
類是AtomicLong
添加了padded(via@sun.misc.compended)
來(lái)消除偽共享的變種版本。緩存行填充對(duì)于大多數(shù)原子來(lái)說(shuō)是繁瑣的,因?yàn)樗鼈兺ǔ2灰?guī)則地分散在內(nèi)存中,因此彼此之間不會(huì)有太大的干擾。但是,駐留在數(shù)組中的原子對(duì)象往往彼此相鄰,因此在沒(méi)有這種預(yù)防措施的情況下,通常會(huì)共享緩存行數(shù)據(jù)(對(duì)性能有巨大的負(fù)面影響)。
3、惰性求值
LongAdder
只有在使用longValue()
獲取當(dāng)前累加值時(shí)才會(huì)真正的去結(jié)算計(jì)數(shù)的數(shù)據(jù),longValue()
方法底層就是調(diào)用sum()
方法,對(duì)base
和Cell
數(shù)組的數(shù)據(jù)累加然后返回,做到數(shù)據(jù)寫入和讀取分離。
而AtomicLong
使用incrementAndGet()
每次都會(huì)返回long
類型的計(jì)數(shù)值,每次遞增后還會(huì)伴隨著數(shù)據(jù)返回,增加了額外的開銷。
4.3 LongAdder實(shí)現(xiàn)原理
之前說(shuō)了,AtomicLong
是多個(gè)線程針對(duì)單個(gè)熱點(diǎn)值value
進(jìn)行原子操作。而LongAdder
是每個(gè)線程擁有自己的槽,各個(gè)線程一般只對(duì)自己槽中的那個(gè)值進(jìn)行CAS操作。
比如有三個(gè)線程同時(shí)對(duì)value增加1,那么value = 1 + 1 + 1 = 3
但是對(duì)于LongAdder
來(lái)說(shuō),內(nèi)部有一個(gè)base
變量,一個(gè)Cell[]
數(shù)組。
base
變量:非競(jìng)爭(zhēng)條件下,直接累加到該變量上
Cell[]
數(shù)組:競(jìng)爭(zhēng)條件下,累加個(gè)各個(gè)線程自己的槽Cell[i]
中
最終結(jié)果的計(jì)算是下面這個(gè)形式:
4.4 ongAdder源碼剖析
前面已經(jīng)用圖分析了LongAdder
高性能的原理,我們繼續(xù)看下LongAdder
實(shí)現(xiàn)的源碼:
public class LongAdder extends Striped64 implements Serializable { public void increment() { add(1L); } public void add(long x) { Cell[] as; long b, v; int m; Cell a; if ((as = cells) != null || !casBase(b = base, b + x)) { boolean uncontended = true; if (as == null || (m = as.length - 1) < 0 || (a = as[getProbe() & m]) == null || !(uncontended = a.cas(v = a.value, v + x))) longAccumulate(x, null, uncontended); } } final boolean casBase(long cmp, long val) { return UNSAFE.compareAndSwapLong(this, BASE, cmp, val); } }
一般我們進(jìn)行計(jì)數(shù)時(shí)都會(huì)使用increment()
方法,每次進(jìn)行**+1操作**,increment()
會(huì)直接調(diào)用add()
方法。
變量說(shuō)明:
- as 表示cells引用
- b 表示獲取的base值
- v 表示 期望值,
- m 表示 cells 數(shù)組的長(zhǎng)度
- a 表示當(dāng)前線程命中的cell單元格
條件分析:
條件一:as == null || (m = as.length - 1) < 0
此條件成立說(shuō)明cells數(shù)組未初始化。如果不成立則說(shuō)明cells數(shù)組已經(jīng)完成初始化,對(duì)應(yīng)的線程需要找到Cell數(shù)組中的元素去寫值。
條件二:(a = as[getProbe() & m]) == null
getProbe()
獲取當(dāng)前線程的hash值,m表示cells長(zhǎng)度-1,cells長(zhǎng)度是2的冪次方數(shù),原因之前也講到過(guò),與數(shù)組長(zhǎng)度取??梢赞D(zhuǎn)化為按位與運(yùn)算,提升計(jì)算性能。
當(dāng)條件成立時(shí)說(shuō)明當(dāng)前線程通過(guò)hash計(jì)算出來(lái)數(shù)組位置處的cell為空,進(jìn)一步去執(zhí)行longAccumulate()
方法。如果不成立則說(shuō)明對(duì)應(yīng)的cell
不為空,下一步將要將x值通過(guò)CAS操作添加到cell中。
條件三:!(uncontended = a.cas(v = a.value, v + x)
主要看a.cas(v = a.value, v + x)
,接著條件二,說(shuō)明當(dāng)前線程hash與數(shù)組長(zhǎng)度取模計(jì)算出的位置的cell有值,此時(shí)直接嘗試一次CAS操作,如果成功則退出if條件,失敗則繼續(xù)往下執(zhí)行longAccumulate()
方法。
接著往下看核心的longAccumulate()
方法,代碼很長(zhǎng),后面會(huì)一步步分析,先上代碼:
java.util.concurrent.atomic.Striped64.:
final void longAccumulate(long x, LongBinaryOperator fn, boolean wasUncontended) { int h; if ((h = getProbe()) == 0) { ThreadLocalRandom.current(); h = getProbe(); wasUncontended = true; } boolean collide = false; for (;;) { Cell[] as; Cell a; int n; long v; if ((as = cells) != null && (n = as.length) > 0) { if ((a = as[(n - 1) & h]) == null) { if (cellsBusy == 0) { Cell r = new Cell(x); if (cellsBusy == 0 && casCellsBusy()) { boolean created = false; try { Cell[] rs; int m, j; if ((rs = cells) != null && (m = rs.length) > 0 && rs[j = (m - 1) & h] == null) { rs[j] = r; created = true; } } finally { cellsBusy = 0; } if (created) break; continue; } } collide = false; } else if (!wasUncontended) wasUncontended = true; else if (a.cas(v = a.value, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break; else if (n >= NCPU || cells != as) collide = false; else if (!collide) collide = true; else if (cellsBusy == 0 && casCellsBusy()) { try { if (cells == as) { Cell[] rs = new Cell[n << 1]; for (int i = 0; i < n; ++i) rs[i] = as[i]; cells = rs; } } finally { cellsBusy = 0; } collide = false; continue; } h = advanceProbe(h); } else if (cellsBusy == 0 && cells == as && casCellsBusy()) { boolean init = false; try { if (cells == as) { Cell[] rs = new Cell[2]; rs[h & 1] = new Cell(x); cells = rs; init = true; } } finally { cellsBusy = 0; } if (init) break; } else if (casBase(v = base, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break; } }
代碼很長(zhǎng),if else
分支很多,除此看肯定會(huì)很頭疼。這里一點(diǎn)點(diǎn)分析,然后結(jié)合畫圖一步步了解其中實(shí)現(xiàn)原理。
我們首先要清楚執(zhí)行這個(gè)方法的前置條件,它們是或的關(guān)系,如上面條件一、二、三
- cells數(shù)組沒(méi)有初始化
- cells數(shù)組已經(jīng)初始化,但是當(dāng)前線程對(duì)應(yīng)的cell數(shù)據(jù)為空
- cells數(shù)組已經(jīng)初始化, 當(dāng)前線程對(duì)應(yīng)的cell數(shù)據(jù)為空,且CAS操作+1失敗
longAccumulate()方法的入?yún)ⅲ?/strong>
- long x 需要增加的值,一般默認(rèn)都是1
- LongBinaryOperator fn 默認(rèn)傳遞的是null
- wasUncontended競(jìng)爭(zhēng)標(biāo)識(shí),如果是false則代表有競(jìng)爭(zhēng)。只有cells初始化之后,并且當(dāng)前線程CAS競(jìng)爭(zhēng)修改失敗,才會(huì)是false
然后再看下Striped64中一些變量或者方法的定義:
- base: 類似于AtomicLong中全局的value值。在沒(méi)有競(jìng)爭(zhēng)情況下數(shù)據(jù)直接累加到base上,或者cells擴(kuò)容時(shí),也需要將數(shù)據(jù)寫入到base上
- collide:表示擴(kuò)容意向,false 一定不會(huì)擴(kuò)容,true可能會(huì)擴(kuò)容。
- cellsBusy:初始化cells或者擴(kuò)容cells需要獲取鎖,
- 0:表示無(wú)鎖狀態(tài) 1:表示其他線程已經(jīng)持有了鎖casCellsBusy(): 通過(guò)CAS操作修改cellsBusy的值,CAS成功代表獲取鎖,返回true
- NCPU:當(dāng)前計(jì)算機(jī)CPU數(shù)量,Cell數(shù)組擴(kuò)容時(shí)會(huì)使用到
- getProbe(): 獲取當(dāng)前線程的hash值
- advanceProbe(): 重置當(dāng)前線程的hash值
接著開始正式解析longAccumulate()源碼:
private static final long PROBE; if ((h = getProbe()) == 0) { ThreadLocalRandom.current(); h = getProbe(); wasUncontended = true; } static final int getProbe() { return UNSAFE.getInt(Thread.currentThread(), PROBE); }
我們上面說(shuō)過(guò)getProbe()
方法是為了獲取當(dāng)前線程的hash
值,具體實(shí)現(xiàn)是通過(guò)UNSAFE.getInt()
實(shí)現(xiàn)的,PROBE
是在初始化時(shí)候獲取當(dāng)前線程threadLocalRandomProbe
的值。
注:Unsafe.getInt()有三個(gè)重載方法getInt(Object o, long offset)、getInt(long address)和getIntVolatile(long address),都是從指定的位置獲取變量的值,只不過(guò)第一個(gè)的offset是相對(duì)于對(duì)象o的相對(duì)偏移量,第二個(gè)address是絕對(duì)地址偏移量。如果第一個(gè)方法中o為null是,offset也會(huì)被作為絕對(duì)偏移量。第三個(gè)則是帶有volatile語(yǔ)義的load讀操作。
如果當(dāng)前線程的hash值h=getProbe()為0,0與任何數(shù)取模都是0,會(huì)固定到數(shù)組第一個(gè)位置,所以這里做了優(yōu)化,使用ThreadLocalRandom
為當(dāng)前線程重新計(jì)算一個(gè)hash
值。最后設(shè)置wasUncontended = true
,這里含義是重新計(jì)算了當(dāng)前線程的hash
后認(rèn)為此次不算是一次競(jìng)爭(zhēng)。hash值被重置就好比一個(gè)全新的線程一樣,所以設(shè)置了競(jìng)爭(zhēng)狀態(tài)為true。
接著執(zhí)行for循環(huán)
,我們可以把for循環(huán)
代碼拆分一下,每個(gè)if條件
算作一個(gè)CASE
來(lái)分析:
final void longAccumulate(long x, LongBinaryOperator fn, boolean wasUncontended) { for (;;) { Cell[] as; Cell a; int n; long v; if ((as = cells) != null && (n = as.length) > 0) { } else if (cellsBusy == 0 && cells == as && casCellsBusy()) { } else if (casBase(v = base, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) } }
如上所示,第一個(gè)if語(yǔ)句代表CASE1
,里面再有if判斷
會(huì)以CASE1.1
這種形式來(lái)講解,下面接著的else if
為CASE2
, 最后一個(gè)為CASE3
CASE1執(zhí)行條件:
if ((as = cells) != null && (n = as.length) > 0) { }
cells數(shù)組不為空,且數(shù)組長(zhǎng)度大于0的情況會(huì)執(zhí)行CASE1,CASE1的實(shí)現(xiàn)細(xì)節(jié)代碼較多,放到最后面講解。
CASE2執(zhí)行條件和實(shí)現(xiàn)原理:
else if (cellsBusy == 0 && cells == as && casCellsBusy()) { boolean init = false; try { if (cells == as) { Cell[] rs = new Cell[2]; rs[h & 1] = new Cell(x); cells = rs; init = true; } } finally { cellsBusy = 0; } if (init) break; }
CASE2
標(biāo)識(shí)cells數(shù)組還未初始化,因?yàn)榕袛?code>cells == as,這個(gè)代表當(dāng)前線程到了這里獲取的cells還是之前的一致。我們可以先看這個(gè)case
,最后再回頭看最為麻煩的CASE1
實(shí)現(xiàn)邏輯。
cellsBusy
上面說(shuō)了是加鎖的狀態(tài),初始化cells數(shù)組
和擴(kuò)容的時(shí)候都要獲取加鎖的狀態(tài),這個(gè)是通過(guò)CAS
來(lái)實(shí)現(xiàn)的,為0代表無(wú)鎖狀態(tài),為1代表其他線程已經(jīng)持有鎖了。cells==as
代表當(dāng)前線程持有的數(shù)組未進(jìn)行修改過(guò),casCellsBusy()
通過(guò)CAS操作去獲取鎖。但是里面的if條件
又再次判斷了cell==as
,這一點(diǎn)是不是很奇怪?通過(guò)畫圖來(lái)說(shuō)明下問(wèn)題:
cells==as雙重判斷說(shuō)明.png
如果上面條件都執(zhí)行成功就會(huì)執(zhí)行數(shù)組的初始化及賦值操作, Cell[] rs = new Cell[2
]表示數(shù)組的長(zhǎng)度為2,rs[h & 1] = new Cell(x)
表示創(chuàng)建一個(gè)新的Cell元素
,value是x值,默認(rèn)為1。
h & 1
類似于我們之前HashMap
或者ThreadLocal
里面經(jīng)常用到的計(jì)算散列桶index
的算法,通常都是hash & (table.len - 1)
,這里就不做過(guò)多解釋了。執(zhí)行完成后直接退出for循環(huán)
。
CASE3執(zhí)行條件和實(shí)現(xiàn)原理:
else if (casBase(v = base, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break;
進(jìn)入到這里說(shuō)明cells正在或者已經(jīng)初始化過(guò)了,執(zhí)行caseBase()
方法,通過(guò)CAS
操作來(lái)修改base
的值,如果修改成功則跳出循環(huán),這個(gè)CASE只有在初始化Cell數(shù)組
的時(shí)候,多個(gè)線程嘗試CAS
修改cellsBusy
加鎖的時(shí)候,失敗的線程會(huì)走到這個(gè)分支,然后直接CAS修改base
數(shù)據(jù)。
CASE1 實(shí)現(xiàn)原理:
分析完了CASE2和CASE3
,我們?cè)僬垲^回看一下CASE1
,進(jìn)入CASE1
的前提是:cells數(shù)組
不為空,已經(jīng)完成了初始化賦值操作。
接著還是一點(diǎn)點(diǎn)往下拆分代碼,首先看第一個(gè)判斷分支CASE1.1
:
if ((a = as[(n - 1) & h]) == null) { if (cellsBusy == 0) { Cell r = new Cell(x); if (cellsBusy == 0 && casCellsBusy()) { boolean created = false; try { Cell[] rs; int m, j; if ((rs = cells) != null && (m = rs.length) > 0 && rs[j = (m - 1) & h] == null) { rs[j] = r; created = true; } } finally { cellsBusy = 0; } if (created) break; continue; } } collide = false; }
這個(gè)if條件中(a = as[(n - 1) & h]) == null
代表當(dāng)前線程對(duì)應(yīng)的數(shù)組下標(biāo)位置的cell
數(shù)據(jù)為null
,代表沒(méi)有線程在此處創(chuàng)建Cell
對(duì)象。
接著判斷cellsBusy==0
,代表當(dāng)前鎖未被占用。然后新創(chuàng)建Cell對(duì)象,接著又判斷了一遍cellsBusy == 0
,然后執(zhí)行casCellsBusy()
嘗試通過(guò)CAS操作修改cellsBusy=1
,加鎖成功后修改擴(kuò)容意向collide = false
;
for (;;) { if ((rs = cells) != null && (m = rs.length) > 0 && rs[j = (m - 1) & h] == null) { rs[j] = r; created = true; } if (created) break; continue; }
上面代碼判斷當(dāng)前線程hash
后指向的數(shù)據(jù)位置元素是否為空,如果為空則將cell
數(shù)據(jù)放入數(shù)組中,跳出循環(huán)。如果不為空則繼續(xù)循環(huán)。
繼續(xù)往下看代碼,CASE1.2:
else if (!wasUncontended) wasUncontended = true; h = advanceProbe(h);
wasUncontended
表示cells
初始化后,當(dāng)前線程競(jìng)爭(zhēng)修改失敗wasUncontended =false
,這里只是重新設(shè)置了這個(gè)值為true
,緊接著執(zhí)行advanceProbe(h)
重置當(dāng)前線程的hash
,重新循環(huán)。
接著看CASE1.3:
else if (a.cas(v = a.value, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break;
進(jìn)入CASE1.3
說(shuō)明當(dāng)前線程對(duì)應(yīng)的數(shù)組中有了數(shù)據(jù),也重置過(guò)hash
值,這時(shí)通過(guò)CAS操作嘗試對(duì)當(dāng)前數(shù)中的value
值進(jìn)行累加x操作,x默認(rèn)為1,如果CAS
成功則直接跳出循環(huán)。
接著看CASE1.4:
else if (a.cas(v = a.value, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break;
如果cells數(shù)組
的長(zhǎng)度達(dá)到了CPU核心數(shù)
,或者cells
擴(kuò)容了,設(shè)置擴(kuò)容意向collide為false
并通過(guò)下面的h = advanceProbe(h)
方法修改線程的probe再重新嘗試
至于這里為什么要提出和CPU數(shù)量
做判斷的問(wèn)題:每個(gè)線程會(huì)通過(guò)線程對(duì)cells[threadHash%cells.length]
位置的Cell
對(duì)象中的value
做累加,這樣相當(dāng)于將線程綁定到了cells
中的某個(gè)cell
對(duì)象上,如果超過(guò)CPU數(shù)量
的時(shí)候就不再擴(kuò)容是因?yàn)?code>CPU的數(shù)量代表了機(jī)器處理能力,當(dāng)超過(guò)CPU
數(shù)量時(shí),多出來(lái)的cells
數(shù)組元素沒(méi)有太大作用。
接著看CASE1.5:
else if (n >= NCPU || cells != as) collide = false;
如果擴(kuò)容意向collide
是false
則修改它為true
,然后重新計(jì)算當(dāng)前線程的hash值繼續(xù)循環(huán),在CASE1.4
中,如果當(dāng)前數(shù)組的長(zhǎng)度已經(jīng)大于了CPU
的核數(shù),就會(huì)再次設(shè)置擴(kuò)容意向collide=false
,這里的意義是保證擴(kuò)容意向?yàn)?code>false后不再繼續(xù)往后執(zhí)行CASE1.6
的擴(kuò)容操作。
接著看CASE1.6分支:
else if (cellsBusy == 0 && casCellsBusy()) { try { if (cells == as) { Cell[] rs = new Cell[n << 1]; for (int i = 0; i < n; ++i) rs[i] = as[i]; cells = rs; } } finally { cellsBusy = 0; } collide = false; continue; }
這里面執(zhí)行的其實(shí)是擴(kuò)容邏輯,首先是判斷通過(guò)CAS
改變cellsBusy
來(lái)嘗試加鎖,如果CAS
成功則代表獲取鎖成功,繼續(xù)向下執(zhí)行,判斷當(dāng)前的cells
數(shù)組和最先賦值的as
是同一個(gè),代表沒(méi)有被其他線程擴(kuò)容過(guò),然后進(jìn)行擴(kuò)容,擴(kuò)容大小為之前的容量的兩倍,這里用的按位左移1位來(lái)操作的。
Cell[] rs = new Cell[n << 1];
到了這里,我們已經(jīng)分析完了longAccumulate()
所有的邏輯,邏輯分支挺多,仔細(xì)分析看看其實(shí)還是挺清晰的,流程圖如下:
我們?cè)倥e一些線程執(zhí)行的例子里面場(chǎng)景覆蓋不全,大家可以按照這種模式自己模擬場(chǎng)景分析代碼流程:
如有問(wèn)題也請(qǐng)及時(shí)指出,我會(huì)第一時(shí)間更正,不勝感激!
4.5 LongAdder的sum方法
當(dāng)我們最終獲取計(jì)數(shù)器值時(shí),我們可以使用LongAdder.longValue()
方法,其內(nèi)部就是使用sum
方法來(lái)匯總數(shù)據(jù)的。
java.util.concurrent.atomic.LongAdder.sum():
public long sum() { Cell[] as = cells; Cell a; long sum = base; if (as != null) { for (int i = 0; i < as.length; ++i) { if ((a = as[i]) != null) sum += a.value; } } return sum; }
實(shí)現(xiàn)很簡(jiǎn)單,base +,遍歷cells數(shù)組中的值,然后累加。
4.6 AtomicLong可以棄用了嗎?
看上去LongAdder
的性能全面超越了AtomicLong
,而且阿里巴巴開發(fā)手冊(cè)也提及到 推薦使用 LongAdder 對(duì)象,比 AtomicLong 性能更好(減少樂(lè)觀鎖的重試次數(shù)),但是我們真的就可以舍棄掉LongAdder
了嗎?
當(dāng)然不是,我們需要看場(chǎng)景來(lái)使用,如果是并發(fā)不太高的系統(tǒng),使用AtomicLong
可能會(huì)更好一些,而且內(nèi)存需求也會(huì)小一些。
我們看過(guò)sum()
方法后可以知道LongAdder
在統(tǒng)計(jì)的時(shí)候如果有并發(fā)更新,可能導(dǎo)致統(tǒng)計(jì)的數(shù)據(jù)有誤差。
而在高并發(fā)統(tǒng)計(jì)計(jì)數(shù)的場(chǎng)景下,才更適合使用LongAdder
。
5、總結(jié)
LongAdder中最核心的思想就是利用空間來(lái)?yè)Q時(shí)間,將熱點(diǎn)value分散成一個(gè)Cell列表來(lái)承接并發(fā)的CAS,以此來(lái)提升性能。
LongAdder的原理及實(shí)現(xiàn)都很簡(jiǎn)單,但其設(shè)計(jì)的思想值得我們品味和學(xué)習(xí)。
也希望大家多多關(guān)注腳本之家的其他內(nèi)容!
相關(guān)文章
關(guān)于Java的ArrayList數(shù)組自動(dòng)擴(kuò)容機(jī)制
這篇文章主要介紹了關(guān)于Java的ArrayList數(shù)組自動(dòng)擴(kuò)容機(jī)制,ArrayList底層是基于數(shù)組實(shí)現(xiàn)的,是一個(gè)動(dòng)態(tài)數(shù)組,自動(dòng)擴(kuò)容,不是線程安全的,只能用在單線程環(huán)境下,需要的朋友可以參考下2023-05-05java?NIO實(shí)現(xiàn)簡(jiǎn)單聊天程序
這篇文章主要為大家詳細(xì)介紹了java?NIO實(shí)現(xiàn)簡(jiǎn)單聊天程序,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11Spring?boot配置綁定和配置屬性校驗(yàn)的方式詳解
這篇文章主要介紹了Spring?boot配置綁定和配置屬性校驗(yàn),SpringBoot 提供了2 種方式進(jìn)行配置綁定,即使用 @ConfigurationProperties 注解和使用 @Value 注解,需要的朋友可以參考下2022-05-05帶有@Transactional和@Async的循環(huán)依賴問(wèn)題的解決
這篇文章主要介紹了帶有@Transactional和@Async的循環(huán)依賴問(wèn)題的解決,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-04-04java 中mongodb的各種操作查詢的實(shí)例詳解
這篇文章主要介紹了java 中mongodb的各種操作查詢的實(shí)例詳解的相關(guān)資料,希望通過(guò)本文能幫助到大家,需要的朋友可以參考下2017-09-09SpringIOC?BeanDefinition的加載流程詳解
這篇文章主要為大家介紹了SpringIOC?BeanDefinition的加載流程詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-10-10IDEA設(shè)置生成帶注釋的getter和setter的圖文教程
通常我們用idea默認(rèn)生成的getter和setter方法是不帶注釋的,當(dāng)然,我們同樣可以設(shè)置idea像MyEclipse一樣生成帶有Javadoc的模板,具體設(shè)置方法,大家參考下本文2018-05-05java字符串?dāng)?shù)組進(jìn)行大小排序的簡(jiǎn)單實(shí)現(xiàn)
下面小編就為大家?guī)?lái)一篇java字符串?dāng)?shù)組進(jìn)行大小排序的簡(jiǎn)單實(shí)現(xiàn)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2016-09-09Java將json對(duì)象轉(zhuǎn)換為map鍵值對(duì)案例詳解
這篇文章主要介紹了Java將json對(duì)象轉(zhuǎn)換為map鍵值對(duì)案例詳解,本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-09-09