Golang無限緩存channel的設(shè)計(jì)與實(shí)現(xiàn)解析
一.引言
Go語言的Channel有兩種類型,一種是無緩存的channle,一個(gè)種是有緩存的channel,但是對于有緩存的channle來說,其緩存長度在創(chuàng)建時(shí)就已經(jīng)固定了,中間也不能擴(kuò)縮容,這導(dǎo)致對某些特定的業(yè)務(wù)場景來說不太方便
業(yè)務(wù)場景如下 :
爬蟲場景,想爬取某個(gè)URL頁面上可達(dá)的所有URL
一個(gè)channle中存在待處理的URL
一堆worker groutine從channle中讀取URL,下載解析網(wǎng)頁并且提取URL,再把URL放入channle
這種場景下,使用消息隊(duì)列或sync包可以解決這個(gè)問題,但是比較復(fù)雜,如果有一個(gè)可以無限緩存的Channle或許是比較好的解決方案
二.設(shè)計(jì)
基于以上特定的業(yè)務(wù)場景,我們的無限緩存Channle應(yīng)該滿足以下要求:
緩存無限,最核心的基本要求。
不能阻塞寫,普通channle的寫操作之所以阻塞,是因?yàn)榫彺鏉M了,無限緩存的channle不應(yīng)該存在這個(gè)問題。
無數(shù)據(jù)時(shí)阻塞讀,此特性保持和普通channle一樣。
讀寫都應(yīng)通過channle操作 :通過channle的 <- 和 ->,第一個(gè)是方便,仍遵循普通channle的語法,第二是不能暴露內(nèi)部緩存
channle被關(guān)閉后,未讀取的數(shù)據(jù)應(yīng)該仍然可讀,此特性和普通channle保持一致
可基于數(shù)據(jù)量自動(dòng)擴(kuò)縮容,在數(shù)據(jù)量很大的時(shí)候要求可以自適應(yīng)的擴(kuò)容,在數(shù)據(jù)量變小后,為了避免內(nèi)存浪費(fèi),要求可以自適應(yīng)的縮容
針對以上要求,設(shè)計(jì)思想如下:
內(nèi)部含有兩個(gè)普通channle,分別用于讀寫,我們將其稱作In和Out,往In中寫入數(shù)據(jù),然后從Out中讀取數(shù)據(jù)
內(nèi)部有一個(gè)可以自適應(yīng)擴(kuò)縮容的buf,當(dāng)寫channle滿了寫不了之后,寫入到此buf中
內(nèi)部含有一個(gè)工作goroutine,總是In中數(shù)據(jù)放入到Out或者buf中
內(nèi)部的自適應(yīng)擴(kuò)縮容buf可以采用雙向環(huán)形鏈表
和采用數(shù)組實(shí)現(xiàn)相比,優(yōu)點(diǎn)如下:
數(shù)組大小是有限制的,語言層面就做不到真正的無限緩存
數(shù)組擴(kuò)容代價(jià)大,而采用雙向環(huán)形鏈表則只用增加節(jié)點(diǎn)即可,縮容同樣
type T interface{} type UnlimitSizeChan struct { bufCount int64 // 統(tǒng)計(jì)元素?cái)?shù)量,原子操作 In chan<- T // 寫入channle Out <-chan T // 讀取channle buffer *RingBuffer // 自適應(yīng)擴(kuò)縮容Buf }
雙向環(huán)形鏈表 如何寫入和讀取數(shù)據(jù),并且做到自適應(yīng)擴(kuò)縮容?
雙向環(huán)形鏈表buf其結(jié)構(gòu)類似于一個(gè)手串,手串上的珠子就可以當(dāng)做是一個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)可以是一個(gè)固定大小的數(shù)組
雙向環(huán)形鏈表buf上分別有兩個(gè)讀寫指針readCell和writeCell,指向?qū)⒁M(jìn)行讀寫操作的cell,負(fù)責(zé)進(jìn)行數(shù)據(jù)讀寫
readCell永遠(yuǎn)追趕writeCell,當(dāng)追上時(shí),代表寫滿了,進(jìn)行擴(kuò)容操作
擴(kuò)容操作即在寫指針的后面插入一個(gè)新建的空閑cell
當(dāng)buf中沒有數(shù)據(jù)時(shí),代表此時(shí)的流量高峰應(yīng)該已經(jīng)過去了,應(yīng)該進(jìn)行縮容操作
縮容操作修改鏈表指向即可,讓buf恢復(fù)原樣,僅保持兩個(gè)cell即可,其他cell由于不再被引用,會(huì)被GC自動(dòng)回收
cell上也有兩個(gè)讀寫指針r和w,分別負(fù)責(zé)進(jìn)行cell上的讀寫,也是r讀指針永遠(yuǎn)追趕w寫指針
type cell struct { Data []T // 數(shù)據(jù)部分 fullFlag bool // cell滿的標(biāo)志 next *cell // 指向后一個(gè)cellBuffer pre *cell // 指向前一個(gè)cellBuffer r int // 下一個(gè)要讀的指針 w int // 下一個(gè)要下的指針 } type RingBuffer struct { cellCount int // cell 數(shù)量統(tǒng)計(jì) readCell *cell // 下一個(gè)要讀的cell writeCell *cell // 下一個(gè)要寫的cell }
數(shù)據(jù)FIFO原則是如何保證的?
無限緩存Channle內(nèi)部的Goroutine,我們稱其為Worker
當(dāng)Out channle還沒有滿時(shí)并且Buf中沒有數(shù)據(jù)時(shí),Worker將讀取In中數(shù)據(jù),將其放入Out,直到Out滿
當(dāng)Buf中有數(shù)據(jù)時(shí),無論Out是否滿,都將將In中讀到的數(shù)據(jù),直接寫入到Buf中,目的就是為了保證數(shù)據(jù)的FIFO原則
當(dāng)cell標(biāo)記為滿時(shí),就算此cell中已經(jīng)被讀取了一部分?jǐn)?shù)據(jù)了,此cell在讀取完所有數(shù)據(jù)之前也不能用于寫,目的也是為了保證數(shù)據(jù)的FIFO原則
三.實(shí)現(xiàn)
1.雙向環(huán)形鏈表實(shí)現(xiàn)
package unlimitSizeChan import ( "errors" "fmt" ) var ErrRingIsEmpty = errors.New("ringbuffer is empty") // CellInitialSize cell的初始容量 var CellInitialSize = 1024 // CellInitialCount 初始化cell數(shù)量 var CellInitialCount = 2 type cell struct { Data []T // 數(shù)據(jù)部分 fullFlag bool // cell滿的標(biāo)志 next *cell // 指向后一個(gè)cellBuffer pre *cell // 指向前一個(gè)cellBuffer r int // 下一個(gè)要讀的指針 w int // 下一個(gè)要下的指針 } type RingBuffer struct { cellCount int // cell 數(shù)量統(tǒng)計(jì) readCell *cell // 下一個(gè)要讀的cell writeCell *cell // 下一個(gè)要寫的cell } // NewRingBuffer 新建一個(gè)ringbuffe,包含兩個(gè)cell func NewRingBuffer() *RingBuffer { rootCell := &cell{ Data: make([]T, CellInitialSize), } lastCell := &cell{ Data: make([]T, CellInitialSize), } rootCell.pre = lastCell lastCell.pre = rootCell rootCell.next = lastCell lastCell.next = rootCell return &RingBuffer{ cellCount: CellInitialCount, readCell: rootCell, writeCell: rootCell, } } // Read 讀取數(shù)據(jù) func (r *RingBuffer) Read() (T, error) { // 無數(shù)據(jù) if r.IsEmpty() { return nil, ErrRingIsEmpty } // 讀取數(shù)據(jù),并將讀指針向右移動(dòng)一位 value := r.readCell.Data[r.readCell.r] r.readCell.r++ // 此cell已經(jīng)讀完 if r.readCell.r == CellInitialSize { // 讀指針歸零,并將該cell狀態(tài)置為非滿 r.readCell.r = 0 r.readCell.fullFlag = false // 將readCell指向下一個(gè)cell r.readCell = r.readCell.next } return value, nil } // Pop 讀一個(gè)元素,讀完后移動(dòng)指針 func (r *RingBuffer) Pop() T { value, err := r.Read() if err != nil { panic(err.Error()) } return value } // Peek 窺視 讀一個(gè)元素,僅讀但不移動(dòng)指針 func (r *RingBuffer) Peek() T { if r.IsEmpty() { panic(ErrRingIsEmpty.Error()) } // 僅讀 value := r.readCell.Data[r.readCell.r] return value } // Write 寫入數(shù)據(jù) func (r *RingBuffer) Write(value T) { // 在 r.writeCell.w 位置寫入數(shù)據(jù),指針向右移動(dòng)一位 r.writeCell.Data[r.writeCell.w] = value r.writeCell.w++ // 當(dāng)前cell寫滿了 if r.writeCell.w == CellInitialSize { // 指針置0,將該cell標(biāo)記為已滿,并指向下一個(gè)cell r.writeCell.w = 0 r.writeCell.fullFlag = true r.writeCell = r.writeCell.next } // 下一個(gè)cell也已滿,擴(kuò)容 if r.writeCell.fullFlag == true { r.grow() } } // grow 擴(kuò)容 func (r *RingBuffer) grow() { // 新建一個(gè)cell newCell := &cell{ Data: make([]T, CellInitialSize), } // 總共三個(gè)cell,writeCell,preCell,newCell // 本來關(guān)系: preCell <===> writeCell // 現(xiàn)在將newcell插入:preCell <===> newCell <===> writeCell pre := r.writeCell.pre pre.next = newCell newCell.pre = pre newCell.next = r.writeCell r.writeCell.pre = newCell // 將writeCell指向新建的cell r.writeCell = r.writeCell.pre // cell 數(shù)量加一 r.cellCount++ } // IsEmpty 判斷ringbuffer是否為空 func (r *RingBuffer) IsEmpty() bool { // readCell和writeCell指向同一個(gè)cell,并且該cell的讀寫指針也指向同一個(gè)位置,并且cell狀態(tài)為非滿 if r.readCell == r.writeCell && r.readCell.r == r.readCell.w && r.readCell.fullFlag == false { return true } return false } // Capacity ringBuffer容量 func (r *RingBuffer) Capacity() int { return r.cellCount * CellInitialSize } // Reset 重置為僅指向兩個(gè)cell的ring func (r *RingBuffer) Reset() { lastCell := r.readCell.next lastCell.w = 0 lastCell.r = 0 r.readCell.r = 0 r.readCell.w = 0 r.cellCount = CellInitialCount lastCell.next = r.readCell }
2.無限緩存Channle實(shí)現(xiàn)
package unlimitSizeChan import "sync/atomic" type T interface{} // UnlimitSizeChan 無限緩存的Channle type UnlimitSizeChan struct { bufCount int64 // 統(tǒng)計(jì)元素?cái)?shù)量,原子操作 In chan<- T // 寫入channle Out <-chan T // 讀取channle buffer *RingBuffer // 自適應(yīng)擴(kuò)縮容Buf } // Len uc中總共的元素?cái)?shù)量 func (uc UnlimitSizeChan) Len() int { return len(uc.In) + uc.BufLen() + len(uc.Out) } // BufLen uc的buf中的元素?cái)?shù)量 func (uc UnlimitSizeChan) BufLen() int { return int(atomic.LoadInt64(&uc.bufCount)) } // NewUnlimitSizeChan 新建一個(gè)無限緩存的Channle,并指定In和Out大小(In和Out設(shè)置得一樣大) func NewUnlimitSizeChan(initCapacity int) *UnlimitSizeChan { return NewUnlitSizeChanSize(initCapacity, initCapacity) } // NewUnlitSizeChanSize 新建一個(gè)無限緩存的Channle,并指定In和Out大小(In和Out設(shè)置得不一樣大) func NewUnlitSizeChanSize(initInCapacity, initOutCapacity int) *UnlimitSizeChan { in := make(chan T, initInCapacity) out := make(chan T, initOutCapacity) ch := UnlimitSizeChan{In: in, Out: out, buffer: NewRingBuffer()} go process(in, out, &ch) return &ch } // 內(nèi)部Worker Groutine實(shí)現(xiàn) func process(in, out chan T, ch *UnlimitSizeChan) { defer close(out) // in 關(guān)閉,數(shù)據(jù)讀取后也把out關(guān)閉 // 不斷從in中讀取數(shù)據(jù)放入到out或者ringbuf中 loop: for { // 第一步:從in中讀取數(shù)據(jù) value, ok := <-in if !ok { // in 關(guān)閉了,退出loop break loop } // 第二步:將數(shù)據(jù)存儲(chǔ)到out或者buf中 if atomic.LoadInt64(&ch.bufCount) > 0 { // 當(dāng)buf中有數(shù)據(jù)時(shí),新數(shù)據(jù)優(yōu)先存放到buf中,確保數(shù)據(jù)FIFO原則 ch.buffer.Write(value) atomic.AddInt64(&ch.bufCount, 1) } else { // out 沒有滿,數(shù)據(jù)放入out中 select { case out <- value: continue default: } // out 滿了,數(shù)據(jù)放入buf中 ch.buffer.Write(value) atomic.AddInt64(&ch.bufCount, 1) } // 第三步:處理buf,一直嘗試把buf中的數(shù)據(jù)放入到out中,直到buf中沒有數(shù)據(jù) for !ch.buffer.IsEmpty() { select { // 為了避免阻塞in,還要嘗試從in中讀取數(shù)據(jù) case val, ok := <-in: if !ok { // in 關(guān)閉了,退出loop break loop } // 因?yàn)檫@個(gè)時(shí)候out是滿的,新數(shù)據(jù)直接放入buf中 ch.buffer.Write(val) atomic.AddInt64(&ch.bufCount, 1) // 將buf中數(shù)據(jù)放入out case out <- ch.buffer.Peek(): ch.buffer.Pop() atomic.AddInt64(&ch.bufCount, -1) if ch.buffer.IsEmpty() { // 避免內(nèi)存泄露 ch.buffer.Reset() atomic.StoreInt64(&ch.bufCount, 0) } } } } // in被關(guān)閉退出loop后,buf中還有可能有未處理的數(shù)據(jù),將他們?nèi)雘ut中,并重置buf for !ch.buffer.IsEmpty() { out <- ch.buffer.Pop() atomic.AddInt64(&ch.bufCount, -1) } ch.buffer.Reset() atomic.StoreInt64(&ch.bufCount, 0) }
四.使用
ch := NewUnlimitSizeChan(1000) // or ch := NewUnlitSizeChanSize(100,200) go func() { ? ? for ...... { ? ? ? ? ... ? ? ? ? ch.In <- ... // send values ? ? ? ? ... ? ? } ? ? close(ch.In) // close In channel }() for v := range ch.Out { // read values ? ? fmt.Println(v) }
以上就是Golang無限緩存channel的設(shè)計(jì)與實(shí)現(xiàn)解析的詳細(xì)內(nèi)容,更多關(guān)于Golang無限緩存channel的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Go集成swagger實(shí)現(xiàn)在線接口文檔的教程指南
wagger是一個(gè)用于設(shè)計(jì),構(gòu)建和文檔化API的開源框架,在Go語言中,Swagger可以幫助后端開發(fā)人員快速創(chuàng)建和定義RESTful API,并提供自動(dòng)生成接口文檔的功能,所以本文給大家介紹了Go集成swagger實(shí)現(xiàn)在線接口文檔的方法,需要的朋友可以參考下2024-11-11Golang 語言極簡類型轉(zhuǎn)換庫cast的使用詳解
本文我們通過 cast.ToString() 函數(shù)的使用,簡單介紹了cast 的使用方法,除此之外,它還支持很多其他類型,在這沒有多多介紹,對Golang 類型轉(zhuǎn)換庫 cast相關(guān)知識(shí)感興趣的朋友一起看看吧2021-11-11Golang優(yōu)雅關(guān)閉channel的方法示例
Goroutine和channel是Go在“并發(fā)”方面兩個(gè)核心feature,下面這篇文章主要給大家介紹了關(guān)于Golang如何優(yōu)雅關(guān)閉channel的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考解決,下面來一起看看吧。2017-11-11go語言計(jì)算兩個(gè)時(shí)間的時(shí)間差方法
這篇文章主要介紹了go語言計(jì)算兩個(gè)時(shí)間的時(shí)間差方法,涉及Python操作時(shí)間的技巧,需要的朋友可以參考下2015-03-03golang中struct和interface的基礎(chǔ)使用教程
Go不同于一般的面向?qū)ο笳Z言,需要我們好好的學(xué)習(xí)研究,下面這篇文章主要給大家介紹了關(guān)于golang中struct和interface的基礎(chǔ)使用的相關(guān)資料,需要的朋友可以參考借鑒,下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。2018-03-03go build -tags構(gòu)建約束試驗(yàn)示例解析
這篇文章主要為大家介紹了go build -tags構(gòu)建約束試驗(yàn)示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-09-09