強悍的Python讀取大文件的解決方案
Python 環(huán)境下文件的讀取問題,請參見拙文 Python基礎之文件讀取的講解
這是一道著名的 Python 面試題,考察的問題是,Python 讀取大文件和一般規(guī)模的文件時的區(qū)別,也即哪些接口不適合讀取大文件。
1. read() 接口的問題
f = open(filename, 'rb') f.read()
我們來讀取 1 個 nginx 的日至文件,規(guī)模為 3Gb 大小。read() 方法執(zhí)行的操作,是一次性全部讀入內(nèi)存,顯然會造成:
MemoryError
...
也即會發(fā)生內(nèi)存溢出。
2. 解決方案:轉換接口
- (1)readlines() :讀取全部的行,構成一個 list,實踐表明還是會造成內(nèi)存的問題;
for line in f.reanlines(): ...
- (2)readline():每次讀取一行,
while True: line = f.readline() if not line: break
- (3)read(1024):重載,指定每次讀取的長度
while True: block = f.read(1024) if not block: break
3. 真正 Pythonic 的方法
真正 Pythonci 的方法,使用 with 結構:
with open(filename, 'rb') as f: for line in f: <do something with the line>
對可迭代對象 f,進行迭代遍歷:for line in f
,會自動地使用緩沖IO(buffered IO)以及內(nèi)存管理,而不必擔心任何大文件的問題。
There should be one – and preferably only one – obvious way to do it.
Reference
How to read large file, line by line in python
總結
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內(nèi)容請查看下面相關鏈接
相關文章
selenium使用chrome瀏覽器測試(附chromedriver與chrome的對應關系表)
這篇文章主要介紹了selenium使用chrome瀏覽器測試(附chromedriver與chrome的對應關系表),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-11-11python?matplotlib庫繪圖實戰(zhàn)之繪制散點圖
Python有著強大的繪圖庫 matplotlib,該庫集成了大量的繪制函數(shù),可以滿足我們平時絕大多數(shù)的繪圖要求,這篇文章主要給大家介紹了關于python?matplotlib庫繪圖實戰(zhàn)之繪制散點圖的相關資料,需要的朋友可以參考下2022-07-07解決jupyter notebook import error但是命令提示符import正常的問題
這篇文章主要介紹了解決jupyter notebook import error但是命令提示符import正常的問題,具有很好的參考2020-04-04pandas DataFrame行或列的刪除方法的實現(xiàn)示例
這篇文章主要介紹了pandas DataFrame行或列的刪除方法的實現(xiàn)示例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-08-08python openCV實現(xiàn)攝像頭獲取人臉圖片
這篇文章主要為大家詳細介紹了python openCV實現(xiàn)攝像頭獲取人臉圖片,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2020-08-08Django模板標簽{% for %}循環(huán),獲取制定條數(shù)據(jù)實例
這篇文章主要介紹了Django模板標簽{% for %}循環(huán),獲取制定條數(shù)據(jù)實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05Python pygorithm模塊用法示例【常見算法測試】
這篇文章主要介紹了Python pygorithm模塊用法,結合實例形式分析了pygorithm模塊的功能、安裝及針對常見算法的相關使用操作技巧,需要的朋友可以參考下2018-08-08Python入門教程(十七)Python的While循環(huán)
這篇文章主要介紹了Python入門教程(十七)Python的While循環(huán),Python是一門非常強大好用的語言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下2023-04-04