淺談C++高并發(fā)場景下讀多寫少的優(yōu)化方案
來源:https://www.cnblogs.com/longbozhan/p/15780194.html
作者:longbozhan
概述
一談到高并發(fā)的優(yōu)化方案,往往能想到模塊水平拆分、數(shù)據(jù)庫讀寫分離、分庫分表,加緩存、加mq等,這些都是從系統(tǒng)架構(gòu)上解決。單模塊作為系統(tǒng)的組成單元,其性能好壞也能很大的影響整體性能,本文從單模塊下讀多寫少的場景出發(fā),探討其解決方案,以其更好的實現(xiàn)高并發(fā)。
不同的業(yè)務(wù)場景,讀和寫的頻率各有側(cè)重,有兩種常見的業(yè)務(wù)場景:
- 讀多寫少:典型場景如廣告檢索端、白名單更新維護(hù)、loadbalancer
- 讀少寫多:典型場景如qps統(tǒng)計
本文針對讀多寫少(也稱一寫多讀)場景下遇到的問題進(jìn)行分析,并探討一種合適的解決方案。
分析
讀多寫少的場景,服務(wù)大部分情況下都是處于讀,而且要求讀的耗時不能太長,一般是毫秒或者更低的級別;更新的頻率就不是那么頻繁,如幾秒鐘更新一次。通過簡單的加互斥鎖,騰出一片臨界區(qū),往往能到達(dá)預(yù)期的效果,保證數(shù)據(jù)更新正確。
但是,只要加了鎖,就會帶來競爭,即使加的是讀寫鎖,雖然讀之間不互斥,但寫一樣會影響讀,而且讀寫同時爭奪鎖的時候,鎖優(yōu)先分配給寫(讀寫鎖的特性)。例如,寫的時候,要求所有的讀請求阻塞住,等到寫線程或協(xié)程釋放鎖之后才能讀。如果寫的臨界區(qū)耗時比較大,則所有的讀請求都會受影響,從監(jiān)控圖上看,這時候會有一根很尖的耗時毛刺,所有的讀請求都在隊列中等待處理,如果在下個更新周期來之前,服務(wù)能處理完這些讀請求,可能情況沒那么糟糕。但極端情況下,如果下個更新周期來了,讀請求還沒處理完,就會形成一個惡性循環(huán),不斷的有讀請求在隊列中等待,最終導(dǎo)致隊列被擠滿,服務(wù)出現(xiàn)假死,情況再惡劣一點的話,上游服務(wù)發(fā)現(xiàn)某個節(jié)點假死后,由于負(fù)載均衡策略,一般會重試請求其他節(jié)點,這時候其他節(jié)點的壓力跟著增加了,最終導(dǎo)致整個系統(tǒng)出現(xiàn)雪崩。
因此,加鎖在高并發(fā)場景下要盡量避免,如果避免不了,需要讓鎖的粒度盡量小,接近無鎖(lock-free)更好,簡單的對一大片臨界區(qū)加鎖,在高并發(fā)場景下不是一種合適的解決方案
雙緩沖
有一種數(shù)據(jù)結(jié)構(gòu)叫雙緩沖,其這種數(shù)據(jù)結(jié)構(gòu)很常見,例如顯示屏的顯示原理,顯示屏顯示的當(dāng)前幀,下一幀已經(jīng)在后臺的buffer準(zhǔn)備好,等時間周期一到,就直接替換前臺幀,這樣能做到無卡頓的刷新,其實現(xiàn)的指導(dǎo)思想是空間換時間,這種數(shù)據(jù)結(jié)構(gòu)的工作原理如下:
- 數(shù)據(jù)分為前臺和后臺
- 所有讀線程讀前臺數(shù)據(jù),不用加鎖,通過一個指針來指向當(dāng)前讀的前臺數(shù)據(jù)
- 只有一個線程負(fù)責(zé)更新,更新的時候,先準(zhǔn)備好后臺數(shù)據(jù),接著直接切指針,這之后所有新進(jìn)來的讀請求都看到了新的前臺數(shù)據(jù)
- 有部分讀還落在老的前臺那里處理,因為更新還不算完成,也就不能退出寫線程,寫線程需要等待所有落在老前臺的線程讀完成后,才能退出,在退出之前,順便再更新一遍老前臺數(shù)據(jù)(也就當(dāng)前的新后臺),可以保證前后臺數(shù)據(jù)一致,這點在做增量更新的時候有用
工程實現(xiàn)上需要攻克的難點
寫線程要怎么知道所有的讀線程在老前臺中的讀完成了呢?
一種做法是讓各個讀線程都維護(hù)一把鎖,讀的時候鎖住,這時候不會影響其他線程的讀,但會影響寫,讀完后釋放鎖(某些時候可能會有通知寫線程的開銷,但寫本身很少),寫線程只需要確認(rèn)鎖有沒有釋放了,確認(rèn)完了后馬上釋放,確認(rèn)這個動作非??欤ㄐ∮?5ns,1s=103ms=106us=10^9ns),讀線程幾乎不會感覺到鎖的存在。
每個線程都有一把自己的鎖,需要用全局的map來做線程id和鎖的映射嗎?
不需要,而且這樣做全局map就要加全局鎖了,又回到了剛開始分析中遇到的問題了。其實,每個線程可以有私有存儲(thread local storage,簡稱TLS),如果是協(xié)程,就對應(yīng)這協(xié)程的TLS(但對于go語言,官方是不支持TLS的,想實現(xiàn)類似功能,要么就想辦法獲取到TLS,要么就不要基于協(xié)程鎖,而是用全局鎖,但盡量讓鎖粒度小,本文主要針對C++語言,暫時不深入討論其他語言的實現(xiàn))。這樣每個讀線程鎖的是自己的鎖,不會影響到其他的讀線程,鎖的目的僅僅是為了保證讀優(yōu)先。
對于線程私有存儲,可以使用pthread_key_create, pthread_setspecific,pthread_getspecific系列函數(shù)
核心代碼實現(xiàn)
讀
template <typename T, typename TLS> int DoublyBufferedData<T, TLS>::Read( typename DoublyBufferedData<T, TLS>::ScopedPtr* ptr) { // ScopedPtr析構(gòu)的時候,會釋放鎖 Wrapper* w = static_cast<Wrapper*>(pthread_getspecific(_wrapper_key)); //非首次讀,獲取pthread local lock if (BAIDU_LIKELY(w != NULL)) { w->BeginRead(); // 鎖住 ptr->_data = UnsafeRead(); ptr->_w = w; return 0; } w = AddWrapper(); if (BAIDU_LIKELY(w != NULL)) { const int rc = pthread_setspecific(_wrapper_key, w); // 首次讀,設(shè)置pthread local lock if (rc == 0) { w->BeginRead(); ptr->_data = UnsafeRead(); ptr->_w = w; return 0; } } return -1; }
寫
template <typename T, typename TLS> template <typename Fn> size_t DoublyBufferedData<T, TLS>::Modify(Fn& fn) { BAIDU_SCOPED_LOCK(_modify_mutex); // 加鎖,保證只有一個寫 int bg_index = !_index.load(butil::memory_order_relaxed); // 指向后臺buffer const size_t ret = fn(_data[bg_index]); // 修改后臺buffer if (!ret) { return 0; } // 切指針 _index.store(bg_index, butil::memory_order_release); bg_index = !bg_index; // 等所有讀老前臺的線程讀結(jié)束 { BAIDU_SCOPED_LOCK(_wrappers_mutex); for (size_t i = 0; i < _wrappers.size(); ++i) { _wrappers[i]->WaitReadDone(); } } // 確認(rèn)沒有讀了,直接修改新后臺數(shù)據(jù),對其新前臺 const size_t ret2 = fn(_data[bg_index]); return ret2; }
完整實現(xiàn)請參考brpc的DoublyBufferData
簡單說說golang中雙緩沖的實現(xiàn)
普通的雙緩沖加載實現(xiàn)
基于計數(shù)器,用atomic,保證原子性,讀進(jìn)入臨界區(qū),計數(shù)器+1,退出-1,寫判斷計數(shù)器為0則切換,但計數(shù)器是全局鎖。這種方案C++也可以采取,只是計數(shù)器畢竟也是全局鎖,性能會差那么一丟丟。即使用智能指針shared_ptr,也會面臨智能指針引用計數(shù)互斥的問題。之所以用計數(shù)器,而不用TLS,是因為go不支持TLS,對比TLS版本和計數(shù)器版本,TLS性能更優(yōu),因為沒有搶計數(shù)器的互斥問題,但搶計數(shù)器本身很快,性能沒測試過,可以試試。
sync.Map的實現(xiàn)
也是基于計數(shù)器,只是計數(shù)器是為了讓讀前臺緩存失效的概率不要太高,有抑制和收斂的作用,實現(xiàn)了讀的無鎖,少部分情況下,前臺緩存讀不到數(shù)據(jù)的時候,會去讀后臺緩存,這時候也要加鎖,同時計數(shù)器+1。計數(shù)器數(shù)值達(dá)到一定程度(超過后臺緩存的元素個數(shù)),就執(zhí)行切換
是否適用于讀少寫多的場景
不合適,雙緩沖優(yōu)先保證讀的性能,寫多讀少的場景需要優(yōu)先保證寫的性能。
相關(guān)文獻(xiàn)
brpc對于雙buffer的描述:https://www.bookstack.cn/read/incubator-brpc/3c7745da34a1418b.md#DoublyBufferedData
go實現(xiàn)的雙buffer(但讀是互斥的,性能先對較差):http://blog.codeg.cn/2016/01/27/double-buffering/
雙buffer的三種實現(xiàn)方案:https://juejin.cn/post/6844904130989801479
一寫多讀:https://blog.csdn.net/lqt641/article/details/55058137
高并發(fā)下的系統(tǒng)設(shè)計:https://www.cnblogs.com/flame540/p/12817529.html
基于計數(shù)器的實現(xiàn):https://www.cnblogs.com/gaoxingnjiagoutansuo/p/15773361.html#4998436
到此這篇關(guān)于淺談C++高并發(fā)場景下讀多寫少的優(yōu)化方案的文章就介紹到這了,更多相關(guān)淺談C++高并發(fā)場景下讀多寫少的優(yōu)化方案內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
關(guān)于STL的erase()陷阱-迭代器失效問題的總結(jié)
下面小編就為大家?guī)硪黄P(guān)于STL的erase()陷阱-迭代器失效問題的總結(jié)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-12-12C++實現(xiàn)LeetCode(187.求重復(fù)的DNA序列)
這篇文章主要介紹了C++實現(xiàn)LeetCode(187.求重復(fù)的DNA序列),本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-07-07C語言實現(xiàn)學(xué)生管理系統(tǒng)的源碼分享
這篇文章主要為大家詳細(xì)介紹了如何利用C語言實現(xiàn)學(xué)生管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-07-07