Python實現(xiàn)像awk一樣分割字符串
若你使用過 Shell 中的 awk 工具,會發(fā)現(xiàn)用它來分割字符串是非常方便的。特別是多個連續(xù)空格會被當(dāng)做一個處理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是轉(zhuǎn)換到 Python 上面來呢?結(jié)果可能是這樣的。
>>> msg='hello world'
>>> msg.split(' ')
['hello', '', '', '', 'world']
與我預(yù)想的結(jié)果不符,多個空格會被分割多次。
那有什么辦法可以達(dá)到 awk 一樣的效果呢?
有兩種方法。
第一種方法
不加參數(shù),這種只適用于將多個空格當(dāng)成一個空格處理,如果不是以空格為分隔符的場景,這種就不適用了。
>>> msg='hello world'
>>> msg.split()
['hello', 'world']
第二種方法
使用 filter 來輔助,這種適用于所有的分隔符,下面以 - 為分隔符來舉例。
>>> msg='hello----world'
>>> msg.split('-')
['hello', '', '', '', 'world']
>>>
>>> filter(None, msg.split('-'))
['hello', 'world']
是不是很神奇,filter 印象中第一個參數(shù)接收的是 函數(shù),這里直接傳 None 居然有奇效。
查看了注釋,原來是這個函數(shù)會適配 None 的情況,當(dāng)?shù)谝粋€參數(shù)是None的時候,返回第二個參數(shù)(可迭代對象)中非空的值,非常方便。
換用函數(shù)的寫法,可以這樣
>>> msg='hello----world'
>>> msg.split('-')
['hello', '', '', '', 'world']
>>>
>>> filter(lambda item: True if item else False, msg.split('-'))
['hello', 'world']
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
BeautifulSoup獲取指定class樣式的div的實現(xiàn)
這篇文章主要介紹了BeautifulSoup獲取指定class樣式的div的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12