Python3標(biāo)準(zhǔn)庫glob文件名模式匹配的問題
1. glob文件名模式匹配
盡管glob API很小,但這個模塊的功能卻很強(qiáng)大。只要程序需要查找文件系統(tǒng)中名字與某個模式匹配的一組文件,就可以使用這個模塊。要創(chuàng)建一個文件名列表,要求其中各個文件名都有某個特定的擴(kuò)展名、前綴或者中間都有某個共同的字符串,就可以使用glob而不用編寫定制代碼來掃描目錄內(nèi)容。
glob的模式規(guī)則與re模塊使用的正則表達(dá)式并不相同。實(shí)際上,glob的模式遵循標(biāo)準(zhǔn)UNIX路徑擴(kuò)展規(guī)則。只使用幾個特殊字符來實(shí)現(xiàn)兩個不同的通配符和字符區(qū)間。模式規(guī)則應(yīng)用于文件名中的段(在路徑分隔符/處截止)。
1.1 實(shí)例數(shù)據(jù)
本節(jié)中的示例假定當(dāng)前工作目錄中存在以下測試文件。
test_files test_files/file.txt test_files/file1.txt test_files/file2.txt test_files/filea.txt test_files/fileb.txt test_files/subfiles test_files/subfiles/subfile.txt
如果這些文件不存在,請glob_maketestdata.py在運(yùn)行以下示例之前使用示例代碼創(chuàng)建它們。
1.2 通配符
星號(*)匹配一個文件名段中的0個或多個字符。例如,test_files/*。
import glob for name in sorted(glob.glob('test_files/*')): print(name)
這個模式會匹配目錄test_files中的所有路徑名(文件或目錄),但不會進(jìn)一步遞歸搜索到子目錄。glob()返回的數(shù)據(jù)不會排序,所以這里的實(shí)例會進(jìn)行排序以便研究結(jié)果。
要列出子目錄中的文件,必須把子目錄包含在模式中。
import glob print('Named explicitly:') for name in sorted(glob.glob('test_files/subfiles/*')): print(' {}'.format(name)) print('Named with wildcard:') for name in sorted(glob.glob('test_files/*/*')): print(' {}'.format(name))
前面顯示的第一種情況顯式列出了子目錄名,第二種情況則依賴一個通配符來查找目錄。
在這里,兩種做法的結(jié)果是一樣的。如果還有另一個子目錄,則通配符會匹配這兩個子目錄,并且兩個子目錄中的文件名都會出現(xiàn)在結(jié)果中。
1.3 單字符通配符
問號(?)也是一個通配符。它會匹配文件名中該位置的單個字符。
import glob for name in sorted(glob.glob('test_files/file?.txt')): print(name)
前面的例子會匹配以file開頭,然后是另外一個任意字符,最后以.txt結(jié)尾的所有文件名。
1.4 字符區(qū)間
如果使用字符區(qū)間([a-z])而不是問號,則可以匹配多個字符中的一個字符。下面這個例子會查找名字中擴(kuò)展名前有一個數(shù)字的所有文件。
import glob for name in sorted(glob.glob('test_files/*[0-9].*')): print(name)
字符區(qū)間[0-9]會匹配所有單個數(shù)字。區(qū)間根據(jù)各字母/數(shù)字的字符碼排序,短橫線指示連續(xù)字符組成的一個不間斷區(qū)間。這個區(qū)間值也可以寫為[0123456789]。
1.5 轉(zhuǎn)義元字符
有時有必要搜索名字中包含一些特殊元字符的文件,glob使用這些特殊元字符表示模式。escape()函數(shù)會建立一個適合的模式,其中的特殊字符會被“轉(zhuǎn)義”,使它們不會被glob擴(kuò)展或解釋為特殊字符。
import glob specials = '?*[' for char in specials: pattern = 'test_files/*' + glob.escape(char) + '.txt' print('Searching for: {!r}'.format(pattern)) for name in sorted(glob.glob(pattern)): print(name) print()
可以通過構(gòu)建一個包含單個元素的字符區(qū)間來轉(zhuǎn)義各個特殊字符。
總結(jié)
到此這篇關(guān)于Python3標(biāo)準(zhǔn)庫glob文件名模式匹配的問題的文章就介紹到這了,更多相關(guān)python glob 文件名匹配內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python?DPED機(jī)器學(xué)習(xí)之實(shí)現(xiàn)照片美化
本篇文章主要介紹了利用Python中的DPED工具實(shí)現(xiàn)照片一鍵美化,可以實(shí)現(xiàn)照片亮度提高和色彩鮮明度提高,代碼簡潔易懂,具有一定學(xué)習(xí)價值,感興趣的小伙伴可以了解一下2021-11-11Python?NumPy教程之?dāng)?shù)據(jù)類型對象詳解
每個?ndarray?都有一個關(guān)聯(lián)的數(shù)據(jù)類型?(dtype)?對象。這個數(shù)據(jù)類型對象(dtype)告訴我們數(shù)組的布局。本文將通過示例詳細(xì)講講NumPy的數(shù)據(jù)類型對象,需要的可以參考一下2022-08-08Django項(xiàng)目中動態(tài)設(shè)置靜態(tài)文件路徑的全過程
這篇文章主要給大家介紹了關(guān)于Django項(xiàng)目中動態(tài)設(shè)置靜態(tài)文件路徑的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2022-02-02配置jupyter notebook全步驟,更改默認(rèn)路徑,jupyter不是問題
這篇文章主要介紹了配置jupyter notebook全步驟,更改默認(rèn)路徑,jupyter不是問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12python爬蟲入門教程--正則表達(dá)式完全指南(五)
要想做爬蟲,不可避免的要用到正則表達(dá)式,如果是簡單的字符串處理,類似于split,substring等等就足夠了,可是涉及到比較復(fù)雜的匹配,當(dāng)然是正則的天下,下面這篇文章主要給大家介紹了python爬蟲之正則表達(dá)式的相關(guān)資料,需要的朋友可以參考下。2017-05-05詳解Python中鍵盤鼠標(biāo)的相關(guān)操作
pyautogui模塊,規(guī)范一點(diǎn)大寫就是PyAutoGUI模塊,是用來實(shí)現(xiàn)自動化腳本的一個十分得力的小助手。他可以操控鍵盤和鼠標(biāo),可以寫許多工具。本文就來講講如何利用這個模塊實(shí)現(xiàn)鍵盤鼠標(biāo)的相關(guān)操作,需要的可以參考一下2023-01-01Python實(shí)現(xiàn)郵件的批量發(fā)送的示例代碼
下面小編就為大家分享一篇Python實(shí)現(xiàn)郵件的批量發(fā)送的示例代碼,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-01-01