python 如何用map()函數(shù)創(chuàng)建多線程任務(wù)
對(duì)于多線程的使用,我們經(jīng)常是用thread來(lái)創(chuàng)建,比較繁瑣. 在Python中,可以使用map函數(shù)簡(jiǎn)化代碼。map可以實(shí)現(xiàn)多任務(wù)的并發(fā)
簡(jiǎn)單說(shuō)明map()實(shí)現(xiàn)多線程原理:
task = [‘任務(wù)1', ‘任務(wù)2', ‘任務(wù)3', …]
map 函數(shù)一手包辦了序列操作、參數(shù)傳遞和結(jié)果保存等一系列的操作,map函數(shù)負(fù)責(zé)將線程分給不同的CPU。
在 Python 中有個(gè)兩個(gè)庫(kù)包含了 map 函數(shù): multiprocessing 和它鮮為人知的子庫(kù) multiprocessing.dummy.dummy 是 multiprocessing 模塊的完整克隆,唯一的不同在于 multiprocessing 作用于進(jìn)程,而 dummy 模塊作用于線程。
代碼如下:
from multiprocessing.dummy import Pool as ThreadPool import os import requests import time import numpy as np # 文件夾位置 filepath = r'C:\Users\Administrator\Desktop\ceshi' pool = ThreadPool(10)#開(kāi)啟線程數(shù),即一次性拋出的請(qǐng)求數(shù) time_list = []#用來(lái)計(jì)算時(shí)間 xml_list = []#數(shù)據(jù)集 pathDir = os.listdir(filepath) for i, allDir in enumerate(pathDir): filename = os.path.join('%s%s' % (filepath + '\\', allDir)) kk = open(filename, 'r', encoding='utf-8').read() data = kk.encode('utf-8') for k in range(10): xml_list.append(data) def res(data): # 訪問(wèn)目標(biāo)服務(wù)器地址 url_host = 'https://mp.csdn.net/mdeditor#' start = time.clock() s = requests.post(url_host, data=data) end = time.clock() if s.status_code == 200: print(end-start) time_list.append(end-start) else: print('請(qǐng)求失敗') # 傳入的參數(shù),1為函數(shù), 2為參數(shù) result = pool.map(res, xml_list) all_arr = np.array(time_list) aver = np.mean(all_arr) variance = np.var(all_arr) mid = np.median(all_arr) min_num = np.min(all_arr) max_num = np.max(all_arr) print('平均值 : '+ str(aver)) print('方差 : ' + str(variance)) print('中值 : ' + str(mid)) print('最小值 : ' + str(min_num)) print('最大值 : ' + str(max_num))
個(gè)人做的小測(cè)試,如果有錯(cuò)誤的地方希望留言提出意見(jiàn)及建議。
補(bǔ)充:python多進(jìn)程(multiprocessing)(map)
map的基本使用:
map函數(shù)一手包辦了序列操作,參數(shù)傳遞和結(jié)果保存等一系列的操作。
from multiprocessing.dummy import Pool poop = Pool(4) # 4代表電腦是多少核的 results = pool.map(爬取函數(shù),網(wǎng)址列表) from multiprocessing.dummy import Pool as ThreadPool import requests import time kv = {'user-agent':'Mozilla/5.0'} def getsource(url): html = requests.get(url,headers=kv) urls = [] for i in range(0,41): i = i*50 newpage = 'https://tieba.baidu.com/f?kw=讀書(shū)&ie=utf-8&pn=' + str(i) urls.append(newpage) # 單線程爬取 time1 = time.time() for each in urls: print(each) getsource(each) time2 = time.time() print('單線程耗時(shí): ' + str(time2-time1)) # 多線程爬取 pool = ThreadPool(8) time3 = time.time() results = pool.map(getsource, urls) pool.close() pool.join() time4 = time.time() print('多線程所消耗時(shí)間:' + str(time4 - time3))
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python基于template實(shí)現(xiàn)字符串替換
這篇文章主要介紹了Python基于template實(shí)現(xiàn)字符串替換,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11淺談Python3實(shí)現(xiàn)兩個(gè)矩形的交并比(IoU)
今天小編就為大家分享一篇淺談Python3實(shí)現(xiàn)兩個(gè)矩形的交并比(IoU),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01python十進(jìn)制和二進(jìn)制的轉(zhuǎn)換方法(含浮點(diǎn)數(shù))
這篇文章主要介紹了python十進(jìn)制和二進(jìn)制的轉(zhuǎn)換方法(含浮點(diǎn)數(shù)),小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-07-07python cx_Oracle模塊的安裝和使用詳細(xì)介紹
這篇文章主要介紹了python cx_Oracle模塊的安裝和使用詳細(xì)介紹的相關(guān)資料,需要的朋友可以參考下2017-02-02python基礎(chǔ)學(xué)習(xí)之如何對(duì)元組各個(gè)元素進(jìn)行命名詳解
python的元祖和列表類似,不同之處在于元祖的元素不能修改,下面這篇文章主要給大家介紹了關(guān)于python基礎(chǔ)學(xué)習(xí)之如何對(duì)元組各個(gè)元素進(jìn)行命名的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2018-07-07基于Python函數(shù)的作用域規(guī)則和閉包(詳解)
下面小編就為大家分享一篇基于Python函數(shù)的作用域規(guī)則和閉包詳解,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2017-11-11Python協(xié)程的實(shí)現(xiàn)方式小結(jié)
協(xié)程是Python中強(qiáng)大的并發(fā)編程工具,允許開(kāi)發(fā)者編寫(xiě)異步代碼以提高程序的性能和效率,在本文中,我們將深入探討Python中協(xié)程的實(shí)現(xiàn)方式,包括生成器、asyncio庫(kù)和async/await關(guān)鍵字,我們還會(huì)提供詳細(xì)的示例代碼,幫助您理解和應(yīng)用協(xié)程,需要的朋友可以參考下2023-11-11