Python使用asyncio包處理并發(fā)詳解
阻塞型I/O和GIL
CPython 解釋器本身就不是線程安全的,因此有全局解釋器鎖(GIL),一次只允許使用一個線程執(zhí)行 Python 字節(jié)碼。因此,一個 Python 進程通常不能同時使用多個 CPU 核心。
然而,標準庫中所有執(zhí)行阻塞型 I/O 操作的函數,在等待操作系統(tǒng)返回結果時都會釋放GIL。這意味著在 Python 語言這個層次上可以使用多線程,而 I/O 密集型 Python 程序能從中受益:一個 Python 線程等待網絡響應時,阻塞型 I/O 函數會釋放 GIL,再運行一個線程。
asyncio
這個包使用事件循環(huán)驅動的協(xié)程實現(xiàn)并發(fā)。 asyncio 大量使用 yield from 表達式,因此與Python 舊版不兼容。
asyncio 包使用的“協(xié)程”是較嚴格的定義。適合asyncio API 的協(xié)程在定義體中必須使用 yield from,而不能使用 yield。此外,適合 asyncio 的協(xié)程要由調用方驅動,并由調用方通過 yield from 調用;
示例1
import threading import asyncio @asyncio.coroutine def hello(): print('Start Hello', threading.currentThread()) yield from asyncio.sleep(5) print('End Hello', threading.currentThread()) @asyncio.coroutine def world(): print('Start World', threading.currentThread()) yield from asyncio.sleep(3) print('End World', threading.currentThread()) # 獲取EventLoop: loop = asyncio.get_event_loop() tasks = [hello(), world()] # 執(zhí)行coroutine loop.run_until_complete(asyncio.wait(tasks)) loop.close()
@asyncio.coroutine把生成器函數標記為協(xié)程類型。
asyncio.sleep(3) 創(chuàng)建一個3秒后完成的協(xié)程。
loop.run_until_complete(future),運行直到future完成;如果參數是 coroutine object,則需要使用 ensure_future()函數包裝。
loop.close() 關閉事件循環(huán)
示例2
import asyncio @asyncio.coroutine def worker(text): """ 協(xié)程運行的函數 :param text: :return: """ i = 0 while True: print(text, i) try: yield from asyncio.sleep(.1) except asyncio.CancelledError: break i += 1 @asyncio.coroutine def client(text, io_used): worker_fu = asyncio.ensure_future(worker(text)) # 假裝等待I/O一段時間 yield from asyncio.sleep(io_used) # 結束運行協(xié)程 worker_fu.cancel() return 'done' loop = asyncio.get_event_loop() tasks = [client('xiaozhe', 3), client('zzzz', 5)] result = loop.run_until_complete(asyncio.wait(tasks)) loop.close() print('Answer:', result)
解釋:
1. asyncio.ensure_future(coro_or_future, *, loop=None):計劃安排一個 coroutine object的執(zhí)行,返回一個 asyncio.Task object。
2. worker_fu.cancel(): 取消一個協(xié)程的執(zhí)行,拋出CancelledError異常。
3. asyncio.wait():協(xié)程的參數是一個由期物或協(xié)程構成的可迭代對象; wait 會分別把各個協(xié)程包裝進一個 Task 對象。
asyncio.Task 對象與threading.Thread對象的比較
asyncio.Task 對象差不多與 threading.Thread 對象等效。
Task 對象用于驅動協(xié)程, Thread 對象用于調用可調用的對象。
Task 對象不由自己動手實例化,而是通過把協(xié)程傳給 asyncio.ensure_future(…) 函數或loop.create_task(…) 方法獲取。
獲取的 Task 對象已經排定了運行時間;Thread 實例則必須調用 start 方法,明確告知讓它運行。
如果想終止任務,可以使用 Task.cancel() 實例方法,在協(xié)程內部拋出CancelledError 異常。
線程與協(xié)程的安全比較
如果使用線程做過重要的編程,因為調度程序任何時候都能中斷線程。必須記住保留鎖,去保護程序中的重要部分,防止多步操作在執(zhí)行的過程中中斷,防止數據處于無效狀態(tài)。
協(xié)程默認會做好全方位保護,以防止中斷。我們必須顯式產出才能讓程序的余下部分運行。對協(xié)程來說,無需保留鎖,在多個線程之間同步操作,協(xié)程自身就會同步,因為在任意時刻只有一個協(xié)程運行。想交出控制權時,可以使用 yield 或 yield from 把控制權交還調度程序。這就是能夠安全地取消協(xié)程的原因:按照定義,協(xié)程只能在暫停的 yield處取消,因此可以處理 CancelledError 異常,執(zhí)行清理操作。
Future(期物)
通常情況下自己不應該創(chuàng)建期物,而只能由并發(fā)框架(concurrent.futures 或 asyncio)實例化。原因很簡單:期物表示終將發(fā)生的事情,而確定某件事會發(fā)生的唯一方式是執(zhí)行的時間已經排定。
asyncio.Future
在 asyncio 包中, BaseEventLoop.create_task(…) 方法接收一個協(xié)程,排定它的運行時間,然后返回一個 asyncio.Task 實例——也是 asyncio.Future 類的實例,因為 Task 是Future 的子類,用于包裝協(xié)程。
asyncio.ensure_future(coro_or_future, *, loop=None)
這個函數統(tǒng)一了協(xié)程和期物:第一個參數可以是二者中的任何一個。如果是 Future 或 Task 對象,那就原封不動地返回。如果是協(xié)程,那么 async 函數會調用loop.create_task(…) 方法創(chuàng)建 Task 對象。 loop= 關鍵字參數是可選的,用于傳入事件循環(huán);如果沒有傳入,那么 async 函數會通過調用 asyncio.get_event_loop() 函數獲取循環(huán)對象。
BaseEventLoop.create_task(coro)
這個方法排定協(xié)程的執(zhí)行時間,返回一個 asyncio.Task 對象。
asyncio 包中有多個函數會自動把參數指定的協(xié)程包裝在 asyncio.Task 對象中,例如 BaseEventLoop.run_until_complete(…) 方法。
asyncio.as_completed
為了集成進度條,我們可以使用的是 as_completed 生成器函數;幸好, asyncio 包提供了這個生成器函數的相應版本。
使用asyncio和aiohttp包
從 Python 3.4 起, asyncio 包只直接支持 TCP 和 UDP。如果想使用 HTTP 或其他協(xié)議,那么要借助第三方包 aiohttp 。
cc_list = ['China', 'USA'] @asyncio.coroutine def get_flag(cc): url = '{}/{cc}/{cc}.gif'.format(BASE_URL, cc=cc.lower()) resp = yield from aiohttp.request('GET', url) image = yield from resp.read() return image @asyncio.coroutine def download_one(name): image = yield from get_flag(name) save_flag(image, name.lower() + '.gif') return name loop = asyncio.get_event_loop() wait_coro = asyncio.wait([download_one(cc) for cc in sorted(cc_list)]) res, _ = loop.run_until_complete(wait_coro) loop.close()
使用 asyncio 包時,我們編寫的異步代碼中包含由 asyncio 本身驅動的協(xié)程(即委派生成器),而生成器最終把職責委托給 asyncio 包或第三方庫(如aiohttp)中的協(xié)程。這種處理方式相當于架起了管道,讓 asyncio 事件循環(huán)(通過我們編寫的協(xié)程)驅動執(zhí)行低層異步 I/O 操作的庫函數。
避免阻塞型調用
有兩種方法能避免阻塞型調用中止整個應用程序的進程:
1. 在單獨的線程中運行各個阻塞型操作
2. 把每個阻塞型操作轉換成非阻塞的異步調用使用
多個線程是可以的,但是各個操作系統(tǒng)線程(Python 使用的是這種線程)消耗的內存達兆字節(jié)(具體的量取決于操作系統(tǒng)種類)。如果要處理幾千個連接,而每個連接都使用一個線程的話,我們負擔不起。
把生成器當作協(xié)程使用是異步編程的另一種方式。對事件循環(huán)來說,調用回調與在暫停的協(xié)程上調用 .send() 方法效果差不多。各個暫停的協(xié)程是要消耗內存,但是比線程消耗的內存數量級小。
上面的腳本為什么會很快
在上面的腳本中,調用 loop.run_until_complete 方法時,事件循環(huán)驅動各個download_one 協(xié)程,運行到第一個 yield from 表達式處時,那個表達式驅動各個get_flag 協(xié)程,然后在get_flag協(xié)程里面運行到第一個 yield from 表達式處時,調用 aiohttp.request(…)函數。這些調用都不會阻塞,因此在零點幾秒內所有請求全部開始。
asyncio 的基礎設施獲得第一個響應后,事件循環(huán)把響應發(fā)給等待結果的 get_flag 協(xié)程。得到響應后, get_flag 向前執(zhí)行到下一個 yield from 表達式處,調用resp.read() 方法,然后把控制權還給主循環(huán)。其他響應會陸續(xù)返回。所有 get_ flag 協(xié)程都獲得結果后,委派生成器 download_one 恢復,保存圖像文件。
async和await
為了簡化并更好地標識異步IO,從Python 3.5開始引入了新的語法async和await,可以讓coroutine的代碼更簡潔易讀。
async和await是針對coroutine的新語法,要使用新的語法,只需要做兩步簡單的替換。
1. 把@asyncio.coroutine替換為async
2. 把yield from替換為await
例如:
@asyncio.coroutine def hello(): print("Hello world!") r = yield from asyncio.sleep(1) print("Hello again!")
等同于
async def hello(): print("Hello world!") r = await asyncio.sleep(1) print("Hello again!")
網站請求實例
import asyncio import aiohttp urls = [ 'http://www.163.com/', 'http://www.sina.com.cn/', 'https://www.hupu.com/', 'http://www.csdn.net/' ] async def get_url_data(u): """ 讀取url的數據 :param u: :return: """ print('running ', u) async with aiohttp.ClientSession() as session: async with session.get(u) as resp: print(u, resp.status, type(resp.text())) # print(await resp.text()) return resp.headers async def request_url(u): """ 主調度函數 :param u: :return: """ res = await get_url_data(u) return res loop = asyncio.get_event_loop() task_lists = asyncio.wait([request_url(u) for u in urls]) all_res, _ = loop.run_until_complete(task_lists) loop.close() print(all_res)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
解決Pytorch dataloader時報錯每個tensor維度不一樣的問題
這篇文章主要介紹了解決Pytorch dataloader時報錯每個tensor維度不一樣的問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05解決Scrapy安裝錯誤:Microsoft Visual C++ 14.0 is required...
下面小編就為大家?guī)硪黄鉀QScrapy安裝錯誤:Microsoft Visual C++ 14.0 is required...的問題。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-10-10使用python提取PowerPoint幻燈片中表格并保存到文本及Excel文件
owerPoint作為廣泛使用的演示工具,常被用于展示各類數據報告和分析結果,其中,表格以其直觀性和結構性成為闡述數據關系的不二之選,本文將介紹如何使用Python來提取PowerPoint幻燈片中的表格,并將表格數據寫入文本文件以及Excel文件,需要的朋友可以參考下2024-06-06Python實用技巧之列表、字典、集合中根據條件篩選數據詳解
這篇文章主要給大家介紹了關于Python技巧之在列表、字典、集合中根據條件篩選數據的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面來一起看看吧2018-07-07