淺談一下python線程池簡單應用
一、線程池簡介
傳統(tǒng)多線程方案會使用“即時創(chuàng)建,即時銷毀”的策略。盡管與創(chuàng)建進程相比,創(chuàng)建線程的時間已經大大的縮短,但是如果提交給線程的任務時執(zhí)行時間較短,而且執(zhí)行次數(shù)及其頻繁,那么服務器將處于不停的創(chuàng)建線程,銷毀線程的狀態(tài)。
一個線程的運行時間可以分為三部分:線程的啟動時間、線程體的運行時間和線程的銷毀時間。
在多線程處理的情景中,如果線程不能被重用,就意味著每次線程運行都要經過啟動、銷毀和運行3個過程。這必然會增加系統(tǒng)相應的時間,減低了效率。
線程池在系統(tǒng)啟動時即創(chuàng)建大量空閑的線程,程序只要將一個函數(shù)提交給線程池,線程池就會啟動一個空閑的線程來執(zhí)行它。
當該函數(shù)執(zhí)行結束后,該線程并不會死亡,而是再次返回到線程池中變成空閑狀態(tài),等待執(zhí)行下一個函數(shù),因此能夠避免多次創(chuàng)建線程,從而節(jié)省線程創(chuàng)建和銷毀的開銷,能帶來更好的性能和穩(wěn)定性。
此外,使用線程池可以有效地控制系統(tǒng)中并發(fā)線程的數(shù)量。當系統(tǒng)中包含有大量的并發(fā)線程時,會導致系統(tǒng)性能急劇下降,甚至導致Python解釋器崩潰,而線程池的最大線程數(shù)參數(shù)可以控制系統(tǒng)中并發(fā)線程的數(shù)量不超過此數(shù)。
服務器CPU數(shù)有限,能夠同時并發(fā)的線程數(shù)有限,并不是開得越多越好,以及線程切換時有開銷的,如果線程切換過于頻繁,反而會使性能降低。
線程池適用于:突發(fā)性大量請求或需要大量線程完成任務,但實際任務處理時間較短的場景
二、線程池在python中的應用
從python3.2開始,標準庫提供了concurrent.futures模塊,它提供了兩個子類:ThreadPoolExecutor和ProcessPoolExecutor。其中ThreadPoolExecutor用于創(chuàng)建線程池,而ProcessPoolExecutor用于創(chuàng)建進程池。不僅可以自動調度線程,還可以做到:
- 主線程可以獲取某一個線程(或任務)的狀態(tài),以及返回值
- 當一個線程完成的時候,主線程能夠立即知道
- 讓多線程和多進程編碼接口一致
使用線程池/進程池來管理并發(fā)編程,只要將相應的 task 函數(shù)提交給線程池/進程池,剩下的事情就由線程池/進程池來搞定。
ThreadPoolExecutor構造函數(shù)有兩個參數(shù):
一個是max_workers參數(shù),用于指定線程池的最大線程數(shù),如果不指定的話則默認是CPU核數(shù)的5倍。
另一個參數(shù)是thread_name_prefix,它用來指定線程池中線程的名稱前綴(可選),如下:
threadPool = ThreadPoolExecutor(max_workers=self.max_workers, thread_name_prefix="test_")
Exectuor 提供了如下常用方法:
| 方法 | 描述 |
| submit(fn, *args, **kwargs) | 將 fn 函數(shù)提交給線程池。*args 代表傳給 fn 函數(shù)的參數(shù),**kwargs 代表以關鍵字參數(shù)的形式為 fn 函數(shù)傳入?yún)?shù) |
| map(func,*iterables, timeout=None, chunksize=1) | 該函數(shù)類似于全局函數(shù) map(func, *iterables),只是該函數(shù)將會啟動多個線程,以異步方式立即對 iterables 執(zhí)行 map 處理 |
| shutdown(wait=True) | 關閉線程池。wait=True,等待池內所有任務執(zhí)行完畢回收完資源后才繼續(xù);wait=False,立即返回,并不會等待池內的任務執(zhí)行完畢。但不管wait參數(shù)為何值,整個程序都會等到所有任務執(zhí)行完畢 |
程序將 task 函數(shù)提交(submit)給線程池后,submit 方法會返回一個 Future 對象,F(xiàn)uture 類主要用于獲取線程任務函數(shù)的返回值。由于線程任務會在新線程中以異步方式執(zhí)行,因此線程執(zhí)行的函數(shù)相當于一個“將來完成”的任務,所以 Python 使用 Future 來代表。
Future 提供了如下方法:
| 方法 | 描述 |
| cancel() | 取消該 Future 代表的線程任務。如果該任務正在執(zhí)行,不可取消,則該方法返回 False;否則,程序會取消該任務,并返回 True |
| cancelled() | 返回 Future 代表的線程任務是否被成功取消 |
| running() | 如果該 Future 代表的線程任務正在執(zhí)行、不可被取消,該方法返回 True |
| done() | 如果該 Funture 代表的線程任務被成功取消或執(zhí)行完成,則該方法返回 True |
| result(timeout=None) | 獲取該 Future 代表的線程任務最后返回的結果。如果 Future 代表的線程任務還未完成,該方法將會阻塞當前線程,其中 timeout 參數(shù)指定最多阻塞多少秒 |
| exception(timeout=None) | 獲取該 Future 代表的線程任務所引發(fā)的異常。如果該任務成功完成,沒有異常,則該方法返回 None |
| add_done_callback(fn) | 為該 Future 代表的線程任務注冊一個“回調函數(shù)”,當該任務成功完成時,程序會自動觸發(fā)該 fn 函數(shù) |
線程池用完后,應調用線程池的shutdown()方法,關閉線程池。也可使用with語句來管理線程池,可避免手動關閉線程池
示例一(使用submit方式):
from concurrent.futures import ThreadPoolExecutor # 導入ThreadPoolExecutor模塊
import time
max_workers = 5
t = []
t1 = time.time()
# 作為線程任務的函數(shù)
def task(x, y):
return x + y
threadPool = ThreadPoolExecutor(max_workers) # 創(chuàng)建最大線程數(shù)為max_workers的線程池
for i in range(20): # 循環(huán)向線程池中提交task任務
future = threadPool.submit(task, i, i+1)
t.append(future)
# 若不需要獲取返回值,則可不需要下面兩行代碼
for i in t:
print(i.result()) # 獲取每個任務的返回值,result()會阻塞主線程
threadPool.shutdown() # 阻塞主線程,所有任務執(zhí)行完后關閉線程池
print(time.time() - t1)示例二(使用map方式):
from concurrent.futures import ThreadPoolExecutor # 導入ThreadPoolExecutor模塊
max_workers = 5
t = []
t1 = time.time()
# 作為線程任務的函數(shù)
def task(x):
return x + (x + 1)
args = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19)
with ThreadPoolExecutor(max_workers) as threadPool: # 創(chuàng)建最大線程數(shù)為max_workers的線程池
results = threadPool.map(task, args) # 啟動線程,并收集每個線任務的返回結果
# 若無返回值,則可不需要下面兩行代碼
for i in results:
print(i) 示例三:
as_complete():是一個生成器,在沒有任務完成的時候會阻塞,在有某個任務完成的時候會yield這個任務,執(zhí)行語句,繼續(xù)阻塞,循環(huán)到所有任務結束,先完成的任務會先通知主線程
from concurrent.futures import ThreadPoolExecutor, as_completed
import time
max_workers = 5
t = []
t1 = time.time()
# 作為線程任務的函數(shù)
def task(x, y):
return x + y
def handle_result(future):
print(future.result())
with ThreadPoolExecutor(max_workers) as threadPool: # 創(chuàng)建最大線程數(shù)為max_workers的線程池
for i in range(20): # 循環(huán)向線程池中提交task任務
future = threadPool.submit(task, i, i+1)
t.append(future)
# 若不需要獲取返回值,則可不需要下面兩行代碼
for future in as_completed(t): # as_completed,哪個先完成就先處理哪個,會阻塞主線程,直到完成所有,除非設置timeout
future.add_done_callback(handle_result)到此這篇關于淺談一下python線程池簡單應用的文章就介紹到這了,更多相關python線程池簡單應用內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python for循環(huán)與getitem的關系詳解
這篇文章主要介紹了Python for循環(huán)與getitem的關系詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-01-01
解決pytorch 損失函數(shù)中輸入輸出不匹配的問題
這篇文章主要介紹了解決pytorch 損失函數(shù)中輸入輸出不匹配的問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-06-06
安裝Python和pygame及相應的環(huán)境變量配置(圖文教程)
下面小編就為大家?guī)硪黄惭bPython和pygame及相應的環(huán)境變量配置(圖文教程)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-06-06

