Python線程池thread?pool創(chuàng)建使用及實例代碼分享
前言
首先線程和線程池不管在哪個語言里面,理論都是通用的。對于開發(fā)來說,解決高并發(fā)問題離不開對多個線程處理。我們先從線程到線程池,從每個線程的運行到多個線程并行,再到線程池管理。由淺入深的理解如何在實際開發(fā)中,使用線程池來提高處理線程的效率。
一、線程
1.線程介紹
線程(英語:thread)是操作系統(tǒng)能夠進行運算調(diào)度的最小單位。它被包含在進程之中,是進程中的實際運作單位。一條線程指的是進程中一個單一順序的控制流,一個進程中可以并發(fā)多個線程,每條線程并行執(zhí)行不同的任務。在Unix System V及Sun中也被稱為輕量進程(lightweight processes),但輕量進程更多指內(nèi)核線程(kernel thread),而把用戶線程(user thread)稱為線程。
60年代,在OS中能擁有資源和獨立運行的基本單位是進程,然而隨著計算機技術(shù)的發(fā)展,進程出現(xiàn)了很多弊端,一是由于進程是資源擁有者,創(chuàng)建、撤消與切換存在較大的時空開銷,因此需要引入輕型進程;二是由于對稱多處理機(SMP)出現(xiàn),可以滿足多個運行單位,而多個進程并行開銷過大。因此在80年代,出現(xiàn)了能獨立運行的基本單位——線程(Threads)。
線程是獨立調(diào)度和分派的基本單位。線程可以為操作系統(tǒng)內(nèi)核調(diào)度的內(nèi)核線程,如Win32線程;由用戶進程自行調(diào)度的用戶線程,如Linux平臺的POSIX Thread;或者由內(nèi)核與用戶進程,如Windows 10的線程,進行混合調(diào)度。
同一進程中的多條線程將共享該進程中的全部系統(tǒng)資源,如虛擬地址空間,文件描述符和信號處理等等。但同一進程中的多個線程有各自的調(diào)用棧(call stack),自己的寄存器環(huán)境(register context),自己的線程本地存儲(thread-local storage)。
一個進程可以有很多線程,每條線程并行執(zhí)行不同的任務。
2.線程特性
輕型實體
線程中的實體基本上不擁有系統(tǒng)資源,只是有一點必不可少的、能保證獨立運行的資源。
線程的實體包括程序、數(shù)據(jù)和TCB。線程是動態(tài)概念,它的動態(tài)特性由線程控制塊TCB(Thread Control Block)描述。TCB包括以下信息:
- (1)線程狀態(tài)
- (2)當線程不運行時,被保存的現(xiàn)場資源。
- (3)一組執(zhí)行堆棧。
- (4)存放每個線程的局部變量主存區(qū)。
- (5)訪問同一個進程中的主存和其它資源。
用于指示被執(zhí)行指令序列的、保留局部變量、少數(shù)狀態(tài)參數(shù)和返回地址等的一組寄存器和堆棧。
獨立調(diào)度和分派的基本單位
在多線程OS中,線程是能獨立運行的基本單位,因而也是獨立調(diào)度和分派的基本單位。由于線程很“輕”,故線程的切換非常迅速且開銷小(在同一進程中的)。
可并發(fā)執(zhí)行
在一個進程中的多個線程之間,可以并發(fā)執(zhí)行,甚至允許在一個進程中所有線程都能并發(fā)執(zhí)行;同樣,不同進程中的線程也能并發(fā)執(zhí)行,充分利用和發(fā)揮了處理機與外圍設備并行工作的能力。
共享進程資源
在同一進程中的各個線程,都可以共享該進程所擁有的資源,這首先表現(xiàn)在:所有線程都具有相同的地址空間(進程的地址空間),這意味著,線程可以訪問該地址空間的每一個虛地址;此外,還可以訪問進程所擁有的已打開文件、定時器等。由于同一個進程內(nèi)的線程共享內(nèi)存和文件,所以線程之間互相通信不必調(diào)用內(nèi)核。
二、線程池
線程池(英語:thread pool):一種線程使用模式。線程過多會帶來調(diào)度開銷,進而影響緩存局部性和整體性能。而線程池維護著多個線程,等待著監(jiān)督管理者分配可并發(fā)執(zhí)行的任務。這避免了在處理短時間任務時創(chuàng)建與銷毀線程的代價。線程池不僅能夠保證內(nèi)核的充分利用,還能防止過分調(diào)度??捎镁€程數(shù)量應該取決于可用的并發(fā)處理器、處理器內(nèi)核、內(nèi)存、網(wǎng)絡sockets等的數(shù)量。 例如,線程數(shù)一般取cpu數(shù)量+2比較合適,線程數(shù)過多會導致額外的線程切換開銷。
任務調(diào)度以執(zhí)行線程的常見方法是使用同步隊列,稱作任務隊列。池中的線程等待隊列中的任務,并把執(zhí)行完的任務放入完成隊列中。
線程池模式一般分為兩種:HS/HA半同步/半異步模式、L/F領導者與跟隨者模式。
HS/HA半同步/半異步模式:
半同步/半異步模式又稱為生產(chǎn)者消費者模式,是比較常見的實現(xiàn)方式,比較簡單。分為同步層、隊列層、異步層三層。同步層的主線程處理工作任務并存入工作隊列,工作線程從工作隊列取出任務進行處理,如果工作隊列為空,則取不到任務的工作線程進入掛起狀態(tài)。由于線程間有數(shù)據(jù)通信,因此不適于大數(shù)據(jù)量交換的場合。
L/F領導者與跟隨者模式:
領導者跟隨者模式,在線程池中的線程可處在3種狀態(tài)之一:領導者leader、追隨者follower或工作者processor。任何時刻線程池只有一個領導者線程。事件到達時,領導者線程負責消息分離,并從處于追隨者線程中選出一個來當繼任領導者,然后將自身設置為工作者狀態(tài)去處置該事件。處理完畢后工作者線程將自身的狀態(tài)置為追隨者。這一模式實現(xiàn)復雜,但避免了線程間交換任務數(shù)據(jù),提高了CPU cache相似性。在ACE(Adaptive Communication Environment)中,提供了領導者跟隨者模式實現(xiàn)。
線程池的伸縮性對性能有較大的影響。
- 創(chuàng)建太多線程,將會浪費一定的資源,有些線程未被充分使用。
- 銷毀太多線程,將導致之后浪費時間再次創(chuàng)建它們。
- 創(chuàng)建線程太慢,將會導致長時間的等待,性能變差。
- 銷毀線程太慢,導致其它線程資源饑餓。
在面向?qū)ο缶幊讨?,?chuàng)建和銷毀對象是很費時間的,因為創(chuàng)建一個對象要獲取內(nèi)存資源或者其它更多資源。在Java中更是如此,虛擬機將試圖跟蹤每一個對象,以便能夠在對象銷毀后進行垃圾回收。所以提高服務程序效率的一個手段就是盡可能減少創(chuàng)建和銷毀對象的次數(shù),特別是一些很耗資源的對象創(chuàng)建和銷毀。如何利用已有對象來服務就是一個需要解決的關(guān)鍵問題,其實這就是一些""池化資源""技術(shù)產(chǎn)生的原因。比如大家所熟悉的數(shù)據(jù)庫連接池正是遵循這一思想而產(chǎn)生的,本文將介紹的線程池技術(shù)同樣符合這一思想。
三、線程池的設計思路
首先我們根據(jù)上述已經(jīng)了解了線程和線程池創(chuàng)建目的以及作用。讓我們自己思考一下,如果是自己的業(yè)務上要用到大量的請求或者是查詢處理,而我們只能的機器并不能一下就接受這么多的task涌入計算,這將消耗我們計算機大量資源。這時我們就該創(chuàng)建線程池來對線程進行管理,我們可以給線程預留一定的空間,讓請求逐個進入線程處理,當請求超過我們給的線程數(shù)量時,等一個線程跑完了再跑下一個,這樣就不會造成資源的浪費和達到資源重復利用。
那么我們建立線程池的思路就有一下幾點:
- 控制線程,給予每個線程任務保證線程正常運行。
- 限制線程數(shù)量,保證系統(tǒng)有足夠的運行空間。
- 資源復用,保證每個線程運行完成任務后能再度利用。
- 控制運行時間,線程運行超過一定時間后停止任務轉(zhuǎn)接下個任務,防止線程堵塞。
有了這些思路,我們就可以充分利用Python自帶的庫來構(gòu)建線程池了。
四、Python線程池構(gòu)建
1.構(gòu)建思路
第一步,我們需要在線程池里面創(chuàng)建出很多個線程。第二步,當?shù)玫揭粋€請求時候,就使用一個線程來運行·它。第三步,若多個任務則分配多個線程來運行。當其中一個線程運行完它的任務之后,將再次進行下一個任務使用。
2.實現(xiàn)庫功能函數(shù)
首先python標準庫里面是有threading庫的,但是該庫并沒有線程池這個模塊。要快速構(gòu)建線程池,可以利用concurrent.futures,該庫提供了ThreadPoolExecutor和ProcessPoolExecutor兩個類,實現(xiàn)了對threading和multiprocessing的進一步抽象。
這里我們只討論ThreadPoolExecutor:
from concurrent.futures import ThreadPoolExecutor
這里我們可以看JAVA關(guān)于線程池的設計:
構(gòu)造方法:
public ThreadPoolExecutor(int corePoolSize, //核心線程數(shù)量 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? int maximumPoolSize,// ? ? 最大線程數(shù) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? long keepAliveTime, // ? ? ? 最大空閑時間 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? TimeUnit unit, ? ? ? ? // ? ? ? ?時間單位 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? BlockingQueue<Runnable> workQueue, ? // ? 任務隊列 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ThreadFactory threadFactory, ? ?// 線程工廠 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? RejectedExecutionHandler handler ?// ?飽和處理機制 ?? ?)? { ... }
參數(shù)和Python創(chuàng)建線程池是一樣的,python創(chuàng)建線程池:
#encoding:utf-8 from concurrent.futures import ThreadPoolExecutor import threading #創(chuàng)建一個包含2條線程的線程池 pool = ThreadPoolExecutor(max_workers = 2) ?#定義兩個線程
這樣就建立了一條簡單的線程池,其中最大線程數(shù)為2 .
def task(i): ? ? sleep_seconds = random.randint(1, 3) ? ?#隨機睡眠時間 ? ? print('線程名稱:%s,參數(shù):%s,睡眠時間:%s' % (threading.current_thread().name, i, sleep_seconds)) ? ? time.sleep(sleep_seconds) ? #定義睡眠時間 for i in range(10):#創(chuàng)建十個任務 ? ? future1 = pool.submit(task, i)
ThreadPoolExecutor()
構(gòu)造線程池實例,傳入max_workers可以設置線程池中最多能同時運行的線程數(shù)目
submit()
提交線程需要執(zhí)行的任務(函數(shù)名和參數(shù))到線程池中,立刻返回一個future對象。
result()
取task的執(zhí)行結(jié)果:
cancel()
取消該 Future 代表的線程任務。如果該任務正在執(zhí)行,不可取消,則該方法返回 False;否則,程序會取消該任務,并返回 True。
調(diào)高點睡眠時間:
cancelled()
返回 Future 代表的線程任務是否被成功取消。
for i in range(5):#創(chuàng)建十個線程 ? ? future1 = pool.submit(task, i) ? ? print(future1.cancelled())
running()
for i in range(5):#創(chuàng)建十個線程 ? ? future1 = pool.submit(task, i) ? ? print(future1.running())
as_completed()
as_completed()方法是一個生成器,在沒有任務完成的時候,會阻塞,在有某個任務完成的時候,會yield這個任務,就能執(zhí)行for循環(huán)下面的語句,然后繼續(xù)阻塞住,循環(huán)到所有的任務結(jié)束。從結(jié)果也可以看出,先完成的任務會先通知主線程。
map()
除了submit,ThreadPoolExecutor還提供了map函數(shù)來添加線程,與常規(guī)的map類似,區(qū)別在于線程池的 map() 函數(shù)會為 iterables 的每個元素啟動一個線程,以并發(fā)方式來執(zhí)行 func 函數(shù). 同時,使用map函數(shù),還會自動獲取返回值。
#向線程池提交5個任務 x = np.arange(5) for i in pool.map(task,x): ? ? ? print('successful')
到此這篇關(guān)于Python線程池(thread pool)創(chuàng)建使用及實例代碼分享的文章就介紹到這了,更多相關(guān)Python線程池創(chuàng)建內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python腳本實現(xiàn)網(wǎng)卡流量監(jiān)控
這篇文章主要介紹了Python腳本實現(xiàn)網(wǎng)卡流量監(jiān)控,本文直接給出實現(xiàn)代碼,需要的朋友可以參考下2015-02-02pytorch中Tensor.to(device)和model.to(device)的區(qū)別及說明
這篇文章主要介紹了pytorch中Tensor.to(device)和model.to(device)的區(qū)別及說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07