為什么在函數(shù)中運(yùn)行的?Python?代碼速度更快?
當(dāng)談到編程效率和性能優(yōu)化時,Python 常常被調(diào)侃為“慢如蝸牛”
有趣的是,Python 代碼在函數(shù)中運(yùn)行往往比在全局范圍內(nèi)運(yùn)行要快得多
小伙伴們可能會有這個疑問:為什么在函數(shù)中運(yùn)行的 Python 代碼速度更快?
今天這篇文章將會解答大家心中的疑惑
原文鏈接:https://stackabuse.com/why-does-python-code-run-faster-in-a-function/
譯文
要理解為什么 Python 代碼在函數(shù)中運(yùn)行得更快,我們需要首先了解 Python 是如何執(zhí)行代碼的
我們知道,python 是一種解釋型語言,它會逐行讀取并執(zhí)行代碼
當(dāng)運(yùn)行一個 python 程序的時候,首先將代碼編譯成字節(jié)碼(一種更接近機(jī)器碼的中間語言)然后 python 解釋器執(zhí)行字節(jié)碼
def hello_world(): print("Hello, World!") import dis dis.dis(hello_world)
#結(jié)果 2 0 LOAD_GLOBAL 0 (print) 2 LOAD_CONST 1 ('Hello, World!') 4 CALL_FUNCTION 1 6 POP_TOP 8 LOAD_CONST 0 (None) 10 RETURN_VALUE
由上所示,python 中的 dis 模塊將函數(shù) hello_world
分解為字節(jié)碼
需要注意的是,python 解釋器是一個執(zhí)行字節(jié)碼的虛擬機(jī),默認(rèn)的 python 解釋器是用 C 編寫的,即 CPython
還有其他的 python 解釋器如 Jython(用 Java 編寫),IronPython(用于 .net)和PyPy(用 Python 和 C 編寫)
為什么 Python 代碼在函數(shù)中運(yùn)行得更快
我們來編寫一個簡單的例子:定義一個函數(shù) my_function
,函數(shù)內(nèi)部包含一個 for 循環(huán)
def my_function(): for i in range(100000000): pass
編譯該函數(shù)的時候,字節(jié)碼可能如下所示
SETUP_LOOP 20 (to 23) LOAD_GLOBAL 0 (range) LOAD_CONST 3 (100000000) CALL_FUNCTION 1 GET_ITER FOR_ITER 6 (to 22) STORE_FAST 0 (i) JUMP_ABSOLUTE 13 POP_BLOCK LOAD_CONST 0 (None) RETURN_VALUE
這里的關(guān)鍵指令是 STORE_FAST
,用于存儲循環(huán)變量 i
現(xiàn)在我們把這個 for 循環(huán)放在 python 腳本的頂層(全局范圍內(nèi)),然后再來看一下字節(jié)碼
for i in range(100000000): pass
SETUP_LOOP 20 (to 23) LOAD_NAME 0 (range) LOAD_CONST 3 (100000000) CALL_FUNCTION 1 GET_ITER FOR_ITER 6 (to 22) STORE_NAME 1 (i) JUMP_ABSOLUTE 13 POP_BLOCK LOAD_CONST 2 (None) RETURN_VALUE
可以看到關(guān)鍵指令變成了 STORE_NAME
,而不是 STORE_FAST
字節(jié)碼 STORE_FAST
比 STORE_NAME
快,因?yàn)樵诤瘮?shù)中,局部變量存儲在固定長度的數(shù)組中,而不是存儲在字典中。這個數(shù)組可以通過索引直接訪問,使得變量檢索非常快
基本上,它只是一個指向列表的指針,并增加了 PyObject 的引用計數(shù),這兩個都是高效的操作
另一方面,全局變量存儲在一個字典。當(dāng)訪問全局變量時,Python 必須執(zhí)行哈希表查找,這涉及計算哈希值,然后檢索與之關(guān)聯(lián)的值
雖然經(jīng)過優(yōu)化,但仍然比基于索引的查找慢
基準(zhǔn)測試驗(yàn)證
我們知道在 Python 中,代碼執(zhí)行的速度取決于代碼執(zhí)行的位置——在函數(shù)中還是在全局作用域中
讓我們用一個簡單的基準(zhǔn)測試的例子來比較一下
首先定義一個求階乘的函數(shù)
def factorial(n): result = 1 for i in range(1, n + 1): result *= i return result
然后在全局范圍內(nèi)執(zhí)行相同的代碼
n = 20 result = 1 for i in range(1, n + 1): result *= i
為了對這兩段代碼進(jìn)行基準(zhǔn)測試,我們可以在 Python 中使用 timeit
模塊,它提供了一種簡單的方法來對少量 Python 代碼進(jìn)行計時
import timeit # 函數(shù) def benchmark(): start = timeit.default_timer() factorial(20) end = timeit.default_timer() print(end - start) benchmark() # Prints: 3.541994374245405e-06 # 全局范圍 start = timeit.default_timer() n = 20 result = 1 for i in range(1, n + 1): result *= i end = timeit.default_timer() print(end - start) # Pirnts: 5.375011824071407e-06
可以看到,函數(shù)代碼的執(zhí)行速度比全局作用域代碼要快
需要注意的是,這兩段代碼最好不要放在同一腳本中,要分開單獨(dú)運(yùn)行
這是因?yàn)?nbsp;
benchmark()
函數(shù)在執(zhí)行時間上增加了一些開銷,并且全局代碼在內(nèi)部進(jìn)行了優(yōu)化
cProfile 分析
python 提供了一個 cProfile
內(nèi)置模塊
讓我們用它來分析一個新例子:在局部和全局范圍內(nèi)計算平方和
import cProfile def sum_of_squares(): total = 0 for i in range(1, 10000000): total += i * i i = None total = 0 def sum_of_squares_g(): global i global total for i in range(1, 10000000): total += i * i def profile(func): pr = cProfile.Profile() pr.enable() func() pr.disable() pr.print_stats() # # Profile function code # print("Function scope:") profile(sum_of_squares) # # Profile global scope code # print("Global scope:") profile(sum_of_squares_g)
上面的例子中,可以認(rèn)為sum_of_squares_g()
函數(shù)是全局的,因?yàn)樗褂昧藘蓚€全局變量, i
和 total
從性能分析結(jié)果中,可以看到函數(shù)代碼在執(zhí)行時間方面比全局更有效
Function scope: 2 function calls in 0.903 seconds Ordered by: standard name ncalls tottime percall cumtime percall filename:lineno(function) 1 0.903 0.903 0.903 0.903 profiler.py:3(sum_of_squares) 1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects} Global scope: 2 function calls in 1.358 seconds Ordered by: standard name ncalls tottime percall cumtime percall filename:lineno(function) 1 1.358 1.358 1.358 1.358 profiler.py:10(sum_of_squares_g) 1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}
如何優(yōu)化 python 函數(shù)的性能
前面我們知道,Python 代碼在函數(shù)中運(yùn)行往往比在全局范圍內(nèi)運(yùn)行要快得多
如果想要進(jìn)一步提高 python 函數(shù)代碼效率,不妨考慮一下使用局部變量而不是全局變量
另一種方法是盡可能使用內(nèi)置函數(shù)和庫。Python 的內(nèi)置函數(shù)是用 C 實(shí)現(xiàn)的,比 Python 快得多
比如 NumPy 和 Pandas,也是用 C 或 C++ 實(shí)現(xiàn)的,它們比實(shí)現(xiàn)同樣功能的 Python 代碼速度更快
又比如同樣是實(shí)現(xiàn)數(shù)字求和的功能,python 內(nèi)置的 sum
函數(shù)要比你自己編寫函數(shù)速度更快
到此這篇關(guān)于為什么在函數(shù)中運(yùn)行的 Python 代碼速度更快?的文章就介紹到這了,更多相關(guān)函數(shù)中運(yùn)行的 Python 代碼速度塊內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python 動態(tài)獲取當(dāng)前運(yùn)行的類名和函數(shù)名的方法
- python每隔N秒運(yùn)行指定函數(shù)的方法
- Python裝飾器限制函數(shù)運(yùn)行時間超時則退出執(zhí)行
- python實(shí)現(xiàn)在每個獨(dú)立進(jìn)程中運(yùn)行一個函數(shù)的方法
- Python中統(tǒng)計函數(shù)運(yùn)行耗時的方法
- 使用python裝飾器計算函數(shù)運(yùn)行時間的實(shí)例
- python獲取當(dāng)前運(yùn)行函數(shù)名稱的方法實(shí)例代碼
- Python使用多進(jìn)程運(yùn)行含有任意個參數(shù)的函數(shù)
相關(guān)文章
python/Matplotlib繪制復(fù)變函數(shù)圖像教程
今天小編就為大家分享一篇python/Matplotlib繪制復(fù)變函數(shù)圖像教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11PyTorch使用Torchdyn實(shí)現(xiàn)連續(xù)時間神經(jīng)網(wǎng)絡(luò)的代碼示例
神經(jīng)常微分方程(Neural ODEs)是深度學(xué)習(xí)領(lǐng)域的創(chuàng)新性模型架構(gòu),它將神經(jīng)網(wǎng)絡(luò)的離散變換擴(kuò)展為連續(xù)時間動力系統(tǒng),本文將基于Torchdyn(一個專門用于連續(xù)深度學(xué)習(xí)和平衡模型的PyTorch擴(kuò)展庫)介紹Neural ODE的實(shí)現(xiàn)與訓(xùn)練方法,需要的朋友可以參考下2025-02-02Python和Java的語法對比分析語法簡潔上python的確完美勝出
Python是一種廣泛使用的解釋型、高級編程、通用型編程語言,由吉多·范羅蘇姆創(chuàng)造,第一版發(fā)布于1991年。這篇文章主要介紹了Python和Java的語法對比,語法簡潔上python的確完美勝出 ,需要的朋友可以參考下2019-05-05Numpy 多維數(shù)據(jù)數(shù)組的實(shí)現(xiàn)
這篇文章主要介紹了Numpy 多維數(shù)據(jù)數(shù)組的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06總結(jié)的幾個Python函數(shù)方法設(shè)計原則
這篇文章主要介紹了總結(jié)的幾個Python函數(shù)方法設(shè)計原則,本文講解了每個函數(shù)只做一件事、保持簡單、保持簡短、輸入使用參數(shù)、輸出使用return語句等內(nèi)容,需要的朋友可以參考下2015-06-06Python Web框架Flask中使用新浪SAE云存儲實(shí)例
這篇文章主要介紹了Python Web框架Flask中使用新浪SAE云存儲實(shí)例,本文是對SAE云存儲的簡單封裝,需要的朋友可以參考下2015-02-02