Python序列操作之進階篇

更新時間：2016年12月08日 09:31:59 投稿：daisy

序列sequence是python中最基本的數(shù)據(jù)結(jié)構(gòu)，本文是Python序列操作的進階篇，本文先對序列做一個簡單的概括，之后將詳細講解下關(guān)于序列的操作方法。文中通過示例代碼介紹的很詳細，有需要的朋友們可以參考借鑒，下面來一起看看吧。

簡介

Python 的序列（sequence）通常指一個可迭代的容器，容器中可以存放任意類型的元素。列表和元組這兩種數(shù)據(jù)類型是最常被用到的序列，python內(nèi)建序列有六種，除了剛剛有說過的兩種類型之外，還有字符串、Unicode字符串、buffer對像和最后一種xrange對像，這幾種都是不常使用的。本文講解了列表推導式、切片命名、列表元素排序、列表元素分組的使用方法。學習了 Python 基本的列表操作后，學習這些進階的操作，讓我們寫出的代碼更加優(yōu)雅簡潔和 pythonic 。

列表推導式

當我們想要根據(jù)某些規(guī)則來構(gòu)造一個列表時，首先想到的應該是列表推導式。列表推導式簡化了循環(huán)操作，例如我們想要從一個原始文件名列表中獲取全部 .py 文件，在沒有列表推導式的情況下，我們通常會這樣做：

file_list = ['foo.py', 'bar.txt', 'spam.py', 'animal.png', 'test.py']
py_list = []
for file in file_list:
if file.endswith('.py'):
py_list.append(file)

print(py_list)
# output
['foo.py', 'spam.py', 'test.py']

而如果使用列表推導式則可簡化為：

py_list = [f for f in file_list if f.endswith('.py')]
print(py_list)
# output
['foo.py', 'spam.py', 'test.py']

列表推導式的介紹網(wǎng)上資源很多，不再贅述。這里只強調(diào)，當你需要根據(jù)某個規(guī)則來構(gòu)造一個列表時，首先應該想一想，能否使用簡潔的列表推導式來實現(xiàn)該需求，否則再回到常規(guī)的方式。

為切片命名

Python 的列表切片使用起來非常方便，但有時也會影響代碼可讀性。例如有一個字符串：

record = '..........19.6..........100..........'

19.6 為產(chǎn)品價格，100 為產(chǎn)品數(shù)量，那么計算總價格為:

但是如果這樣寫，可能過一段時間我們再來讀代碼時已經(jīng)忘記了 record[10:14] 、record[24:27] 切出來的究竟是什么？為了解決上述問題，可以給切片命個名來增強可讀性。

record = '..........19.6..........100..........'
price = slice(10, 14)
count = slice(24, 27)
total_price = float(record[price])*int(record[count])

slice 接收的參數(shù)格式為 slice(stop) 、slice(start, stop[, step]) 。如果只接收了一個參數(shù)，則等價于切片語法 [:stop] ，如果接收兩個參數(shù)，則等價于切片語法 [start:stop] ，如果接收三個參數(shù)，則等價于切片語法 [start:stop:step] 。

排序

排序相關(guān)的任務通常由內(nèi)置函數(shù) sorted 完成。需要排序的元素一般存放在一個列表容器中，列表可以存放任意類型的元素，而 sorted 函數(shù)的 key 關(guān)鍵字使得我們能夠輕松地指定元素排序的關(guān)鍵字，讓排序變得異常簡單。下面將給出幾個常見的排序例子以說明 key 關(guān)鍵字的使用方法。注意 Python3 和 Python2 的排序方法不能通用，下面的例子只適用于 Python3 ，Python2 的排序方法未包含在本文中。

情況一

列表中的元素已經(jīng)是可比較元素，直接將列表傳入 sorted 函數(shù)即可返回一個已排序列表。默認為升序排列，降序排列可以指定 reverse 參數(shù)，例如：

>>> l = [3,5,4,1,8]
>>> sorted(l)
[1, 3, 4, 5, 8]
>>> sorted(l, reverse=True)
[8, 5, 4, 3, 1]
>>>

情況二

需要排序的元素是一個元組或者字典，希望根據(jù)我指定的關(guān)鍵字來排序，例如有如下兩個列表：

l_v1 = [('b',2),('a',1),('c',3),('d',4)]
l_v2 = [
 {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
 {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
 {'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
 {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]

l_v1 是一個元組列表， l_v2 是一個字典列表。對 l_v1 我們希望根據(jù)元組中第二個元素來排序，對 l_v2 我們希望根據(jù)字典的關(guān)鍵字 uid 進行排序。

sorted 函數(shù)接收一個關(guān)鍵字參數(shù) key ，該參數(shù)指定一個可調(diào)用函數(shù)，函數(shù)返回一個值（只要是可比較的），那么 sorted 函數(shù)將根據(jù)返回的關(guān)鍵字對列表中的元素進行排序。

例如對上面的例子：

>>> l_v1 = [('b',2),('a',1),('c',3),('d',4)]
>>> sorted(l_v1, key=lambda x: x[1])
[('a', 1), ('b', 2), ('c', 3), ('d', 4)]
>>> l_v2 = [
{'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
{'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
{'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]
>>> sorted(l_v2, key=lambda x: x['uid'])
[{'lname': 'Cleese', 'uid': 1001, 'fname': 'John'}, {'lname': 'Beazley', 'uid': 1002, 'fname': 'David'}, {'lname': 'Jones', 'uid': 1003, 'fname': 'Brian'}, {'lname': 'Jones', 'uid': 1004, 'fname': 'Big'}]

這里 lambda 函數(shù)是一個常用的技巧。lambda 關(guān)鍵字后邊的 x 是該函數(shù)接收的參數(shù)，冒號后邊的表達式是該函數(shù)的返回值。對 l_v1 來說，傳遞給參數(shù) x 的就是每一個元組，其返回元組的第二個元素用于排序；對 l_v2 來說，傳遞給參數(shù) x 的就是列表中的每一個字典元素，其返回字典中 uid 對應的值用于排序。

除了使用匿名函數(shù) lambda 這種通用的方法外，Python 標準庫 operator 為我們提供了一個 itemgetter 函數(shù)替代我們寫的 lambda 函數(shù)，且其性能會比使用 lambda 函數(shù)略有提升。

>>> from operator import itemgetter
>>> l_v1 = [('b',2),('a',1),('c',3),('d',4)]
>>> sorted(l_v1, key=itemgetter(1))
[('a', 1), ('b', 2), ('c', 3), ('d', 4)]
>>> l_v2 = [
{'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
{'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
{'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]
>>> sorted(l_v2, key=itemgetter('uid'))
[
{'lname': 'Cleese', 'uid': 1001, 'fname': 'John'}, 
{'lname': 'Beazley', 'uid': 1002, 'fname': 'David'}, 
{'lname': 'Jones', 'uid': 1003, 'fname': 'Brian'}, 
{'lname': 'Jones', 'uid': 1004, 'fname': 'Big'}
]

以上例子均是返回一個單一的值用于排序關(guān)鍵字，前面說過，關(guān)鍵字 key 接收的函數(shù)可以返回任意的可比較對象。例如在 python 中，元組是可以比較的。對元組的比較規(guī)則為首先比較元組中第一個位置上的元素，如果相等，在比較第二個位置上的元素，依次類推。回到 l_v2 的例子，假設(shè)現(xiàn)在需求變了，我們首先對 lname 對應的值排序，如果 lname 對應的值相等，那么再根據(jù) fname 確定其順序。

>>> l_v2 = [
 {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
 {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
 {'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
 {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]
>>> sorted(l_v2, key=lambda x: (x['lname'], x['fname']))
[
 {'lname': 'Beazley', 'uid': 1002, 'fname': 'David'}, 
 {'lname': 'Cleese', 'uid': 1001, 'fname': 'John'}, 
 {'lname': 'Jones', 'uid': 1004, 'fname': 'Big'}, 
 {'lname': 'Jones', 'uid': 1003, 'fname': 'Brian'}
]

這個例子中，lambda 函數(shù)返回的不再是一個標量值，而是一個元組 (x['lname'], x['fname']) ，根據(jù)元組的比較規(guī)則，首先根據(jù)元組的第一個位置上的元素 x['lname'] 的大小排序，由于列表中有兩個字典其 lname 對應的值都為 Jones，因此再根據(jù)元組第二個位置的元素 x['fname'] 的值排序，由于 Big 比 Brian 要小（按字母順序依次比較），所以 Big 排在了前面。

同樣使用 itemgetter 函數(shù)也是可以的，且性能會略有提升。此外我覺得 itemgetter 比 lambda 更加簡潔和可讀一點。

>>> l_v2 = [
 {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
 {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
 {'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
 {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]
>>> sorted(l_v2, key=itemgetter('lname', 'fname'))
[
 {'lname': 'Beazley', 'uid': 1002, 'fname': 'David'}, 
 {'lname': 'Cleese', 'uid': 1001, 'fname': 'John'}, 
 {'lname': 'Jones', 'uid': 1004, 'fname': 'Big'}, 
 {'lname': 'Jones', 'uid': 1003, 'fname': 'Brian'}
]

情況三

需要排序的元素是一個 Python 對象，我們希望根據(jù)其某個屬性值來排序。例如一個存放 User 對象的列表如下，根據(jù)其 name 屬性排序：

class User:
 def __init__(self, name):
  self.name = name
def __str__(self):
return 'User: %s' % self.name

__repr__ = __str__ # 為了能夠讓 User 在解釋器中顯示為 'User: name' 的格式

user_list = [User('John'), User('David'), User('Big'), User('Alen')]

方法與前面的一樣，定義一個函數(shù)返回 User 的 name 屬性的值，把該函數(shù)傳給 sorted 的 key 參數(shù)。

>>> user_list = [User('John'), User('David'), User('Big'), User('Alen')]
>>> sorted(user_list, key=lambda x: x.name)
>>> sorted(user_list, key=lambda x: x.name)
[User: Alen, User: Big, User: David, User: John]

但是，itemgetter 方法不再起作用，取而代之的是 attrgetter 方法。

>>> sorted(user_list, key=attrgetter('name'))
[User: Alen, User: Big, User: David, User: John]

attrgetter 與 itemgetter 用法完全一致，只是 itemgetter 用于獲取某個位置索引或者字典關(guān)鍵字的取值，而 attrgetter 用于獲取對象的屬性值。

PS：sorted 返回的是原始列表的一個已排序的副本，而原始列表的順序并沒有任何變化。如果你只想就地排序（即排序原始列表本身），則直接調(diào)用 list 的 sort 方法即可：list.sort() 。其用法與 sorted 函數(shù)一樣，只是該函數(shù)沒有返回值，調(diào)用后原始列表已變?yōu)橐粋€已排序列表。

對序列中的元素進行分組

和排序類似，現(xiàn)想根據(jù)列表中元素的某個關(guān)鍵字分組，使關(guān)鍵字相同的元素分到同一組，并可以對分好的組進行進一步處理。例如有如下的一個列表：

rows = [
 {'address': '5412 N CLARK', 'date': '07/01/2012'},
 {'address': '5148 N CLARK', 'date': '07/04/2012'},
 {'address': '5800 E 58TH', 'date': '07/02/2012'},
 {'address': '2122 N CLARK', 'date': '07/03/2012'},
 {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'},
 {'address': '1060 W ADDISON', 'date': '07/02/2012'},
 {'address': '4801 N BROADWAY', 'date': '07/01/2012'},
 {'address': '1039 W GRANVILLE', 'date': '07/04/2012'},
]

列表的元素為字典，現(xiàn)想根據(jù)字典的 date 分組，使日期（ date ）相同的元素分到一個組。Python 的 itertools 模塊中的 groupby 函數(shù)可以很好地解決該問題。為了使用 groupby 函數(shù)，首先需要對列表排序：

>>> from operator import itemgetter
>>> sorted_rows = sorted(rows, key=itemgetter('date'))

groupby 也和 sorted 一樣有一個 key 關(guān)鍵字參數(shù)，其接收一個可調(diào)用函數(shù)，該函數(shù)返回的值被用做分組的關(guān)鍵字，其用法和 sorted 的 key 關(guān)鍵字參數(shù)一樣。

>>> for date, items in groupby(sorted_rows, key=itemgetter('date')):
 print(date)
 for i in items:
  print(' ', i)
07/01/2012
{'address': '5412 N CLARK', 'date': '07/01/2012'}
{'address': '4801 N BROADWAY', 'date': '07/01/2012'}
07/02/2012
{'address': '5800 E 58TH', 'date': '07/02/2012'}
{'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}
{'address': '1060 W ADDISON', 'date': '07/02/2012'}
07/03/2012
{'address': '2122 N CLARK', 'date': '07/03/2012'}
07/04/2012
{'address': '5148 N CLARK', 'date': '07/04/2012'}
{'address': '1039 W GRANVILLE', 'date': '07/04/2012'}

可以看到 groupby 返回的值分別是用于分組的關(guān)鍵字對應的值和該組的全部成員。groupby 實際返回一個生成器，通過迭代即可分別對各組進行處理。值得注意的一點是，分組前對列表排序這一步必不可少，否則對于非緊鄰的元素即使其值相同也會被分在不同組。

總結(jié)

以上就是關(guān)于python序列進階篇的全部內(nèi)容，希望本文的內(nèi)容對大家學習或者使用python能有所幫助，如果有疑問大家可以留言交流，謝謝大家對腳本之家的支持。

您可能感興趣的文章: