舉例詳解Python中yield生成器的用法
yield是生成的意思,但是在python中則是作為生成器理解,生成器的用處主要可以迭代,這樣簡化了很多運算模型(還不是很了解是如何簡化的)。
yield是一個表達式,是有返回值的.
當(dāng)一個函數(shù)中含有yield時,它不再是一個普通的函數(shù),而是一個生成器.當(dāng)該函數(shù)被調(diào)用時不會自動執(zhí)行,而是暫停,見第一個例子:
例1:
>>> def mygenerator(): ... print 'start...' ... yield 5 ... >>> mygenerator() //在此處調(diào)用,并沒有打印出start...說明存在yield的函數(shù)沒有被運行,即暫停 <generator object mygenerator at 0xb762502c> >>> mygenerator().next() //調(diào)用next()即可讓函數(shù)運行. start... 5 >>>
如一個函數(shù)中出現(xiàn)多個yield則next()會停止在下一個yield前,見例2:
例2:
>>> def mygenerator(): ... print 'start...' ... yield 5 ... >>> mygenerator() //在此處調(diào)用,并沒有打印出start...說明存在yield的函數(shù)沒有被運行,即暫停 <generator object mygenerator at 0xb762502c> >>> mygenerator().next() //調(diào)用next()即可讓函數(shù)運行. start... 5 >>>
為什么yield 5會輸出5,yield 23會輸出23?
我們猜測可能是因為yield是表達式,存在返回值.
那么這是否可以認為yield 5的返回值一定是5嗎?實際上并不是這樣,這個與send函數(shù)存在一定的關(guān)系,這個函數(shù)實質(zhì)上與next()是相似的,區(qū)別是send是傳遞yield表達式的值進去,而next不能傳遞特定的值,只能傳遞None進去,因此可以認為g.next()和g.send(None)是相同的。見例3:
例3:
>>> def fun(): ... print 'start...' ... m = yield 5 ... print m ... print 'middle...' ... d = yield 12 ... print d ... print 'end...' ... >>> m = fun() //創(chuàng)建一個對象 >>> m.next() //會使函數(shù)執(zhí)行到下一個yield前 start... 5 >>> m.send('message') //利用send()傳遞值 message //send()傳遞進來的 middle... 12 >>> m.next() None //可見next()返回值為空 end... Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
在multiprocess中的使用
python在處理數(shù)據(jù)的時候,memory-heavy 的數(shù)據(jù)往往會導(dǎo)致程序沒辦反運行或者運行期間服務(wù)器其他程序效率受到影響。這種情況往往會把數(shù)據(jù)集合變?yōu)橥ㄟ^genertor來遍歷。
但同時如我們所知,generoter看似只能被單進程消費,這樣效率很低。
generator 可以被pool.map消費。
看一下pool.py的源碼。
for i, task in enumerate(taskseq): ... try: put(task) except IOError: debug('could not put task on queue') break
實際是先將generator全部消費掉放到queue中。然后通過map來并行。這樣是解決了使用map來并行。
但是依然沒有解決占用內(nèi)存的問題。這里有兩步占用內(nèi)存。
- 第一步是全部消費掉的generator。
- 第二步并行運算全部data。
解決第一個問題,通過部分消費generator來達到。
解決第二個問題,可以通過imap來達到.
示例代碼如下:
import multiprocessing as mp import itertools import time def g(): for el in xrange(50): print el yield el import os def f(x): time.sleep(1) print str(os.getpid()) +" "+ str(x) return x * x if __name__ == '__main__': pool = mp.Pool(processes=4) # start 4 worker processes go = g() result = [] N = 11 while True: g2 = pool.imap(f, itertools.islice(go, N)) if g2: for i in g2: result.append(i) time.sleep(1) else: break print(result)
ps: 使用注意事項。在produce數(shù)據(jù)的時候,盡量少做操作,應(yīng)為即使是map也是單線程的來消費數(shù)據(jù)。所以盡量把操作放到map中作。這樣才能更好的利用多進程提高效率。
相關(guān)文章
python 實現(xiàn)德洛內(nèi)三角剖分的操作
這篇文章主要介紹了python 實現(xiàn)德洛內(nèi)三角剖分的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04pytorch finetuning 自己的圖片進行訓(xùn)練操作
這篇文章主要介紹了pytorch finetuning 自己的圖片進行訓(xùn)練操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-06-06Python獲取當(dāng)前腳本文件夾(Script)的絕對路徑方法代碼
在本篇文章中小編給各位整理了關(guān)于Python獲取當(dāng)前腳本文件夾(Script)的絕對路徑實例代碼內(nèi)容,有需要的朋友們學(xué)習(xí)下。2019-08-08Python使用openpyxl實現(xiàn)Excel超鏈接批量化設(shè)置
在Excel中,超鏈接是一種非常有用的功能,本文我們將介紹如何使用Python來處理Excel中的超鏈接,以及如何將超鏈接與對應(yīng)的工作表鏈接起來,需要的可以參考一下2023-07-07python爬取NUS-WIDE數(shù)據(jù)庫圖片
本文給大家分享的是使用Python制作爬蟲爬取圖片的小程序,非常的簡單,但是很實用,有需要的小伙伴可以參考下2016-10-10對python讀取zip壓縮文件里面的csv數(shù)據(jù)實例詳解
今天小編就為大家分享一篇對python讀取zip壓縮文件里面的csv數(shù)據(jù)實例詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02利用OpenCV+Tensorflow實現(xiàn)的手勢識別
這幾天沒事,想著再學(xué)點一些視覺識別方向的東西,因為之前做了驗證碼識別,有了機器學(xué)習(xí)的信心,因此這次打算做個手勢識別,下面這篇文章主要給大家介紹了關(guān)于利用OpenCV+Tensorflow實現(xiàn)的手勢識別的相關(guān)資料,需要的朋友可以參考下2022-11-11