python3 cookbook中常遇問題解答
數(shù)據(jù)結(jié)構(gòu)與算法
將序列分解為單獨的變量
問題:現(xiàn)在有一個包含 N 個元素的元組或者是序列,怎樣將它里面的值解壓后同時賦值給 N 個變量?
解答:任何的序列(或者是可迭代對象)可以通過一個簡單的賦值操作來分解為單獨的變量。 唯一的要求就是變量的總數(shù)和結(jié)構(gòu)必須與序列相吻合。
代碼示例:(當(dāng)前環(huán)境為python3.8版本)
p = (1, 2) x, y = p x ? # 1 y ? # 2 data = [ 'ABC', 20, 51.1, (2023, 2, 5) ] name, age, price, date = data name ?# 'ABC' date ?# ?(2023, 2, 5)
解壓可迭代對象賦值給多個變量
問:如果一個可迭代對象的元素個數(shù)超過變量個數(shù)時,會拋出一個 ValueError。 那么怎樣才能從這個可迭代對象中解壓出 N 個元素出來?
解答:Python 的星號表達(dá)式可以用來解決這個問題。比如,你在學(xué)習(xí)一門課程,在學(xué)期末的時候, 你想統(tǒng)計下家庭作業(yè)的平均成績,但是排除掉第一個和最后一個分?jǐn)?shù)。如果只有四個分?jǐn)?shù),你可能就直接去簡單的手動賦值, 但如果有 24 個呢?這時候星號表達(dá)式就派上用場了。
def drop_first_last(grades): first, *middle, last = grades return avg(middle)
另外一種情況,假設(shè)你現(xiàn)在有一些用戶的記錄列表,每條記錄包含一個名字、郵件,接著就是不確定數(shù)量的電話號碼。 你可以像下面這樣分解這些記錄:
record = ('Dave', 'dave@example.com', '773-555-1212', '847-555-1212') name, email, *phone_numbers = record name # 'Dave' email # 'dave@example.com' phone_numbers # ['773-555-1212', '847-555-1212']
值得注意的是上面解壓出的 phone_numbers 變量永遠(yuǎn)都是列表類型,不管解壓的電話號碼數(shù)量是多少(包括 0 個)。
查找最大或最小的 N 個元素
問題:怎樣從一個集合中獲得最大或者最小的 N 個元素列表?
解答:heapq 模塊有兩個函數(shù):nlargest() 和 nsmallest() 可以完美解決這個問題。
import heapq nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2] print(heapq.nlargest(3, nums)) # Prints [42, 37, 23] print(heapq.nsmallest(3, nums)) # Prints [-4, 1, 2]
兩個函數(shù)都能接受一個關(guān)鍵字參數(shù),用于更復(fù)雜的數(shù)據(jù)結(jié)構(gòu)中:
portfolio = [ {'name': 'IBM', 'shares': 100, 'price': 91.1}, {'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}, {'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'ACME', 'shares': 75, 'price': 115.65} ] cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price']) cheap # [{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09},{'name': 'HPQ', 'shares': 35, 'price': 31.75}] expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price']) expensive # [{'name': 'AAPL', 'shares': 50, 'price': 543.22},{'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]
字典的運算
問題:怎樣在數(shù)據(jù)字典中執(zhí)行一些計算操作(比如求最小值、最大值、排序等等)?
解答:考慮下面的股票名和價格映射字典
prices = { 'ACME': 45.23, 'AAPL': 612.78, 'IBM': 205.55, 'HPQ': 37.20, 'FB': 10.75 }
為了對字典值執(zhí)行計算操作,通常需要使用 zip() 函數(shù)先將鍵和值反轉(zhuǎn)過來。 比如,下面是查找最小和最大股票價格和股票值的代碼:
min_price = min(zip(prices.values(), prices.keys())) # min_price is (10.75, 'FB') max_price = max(zip(prices.values(), prices.keys())) # max_price is (612.78, 'AAPL')
類似的,可以使用 zip() 和 sorted() 函數(shù)來排列字典數(shù)據(jù):
prices_sorted = sorted(zip(prices.values(), prices.keys())) # prices_sorted is [(10.75, 'FB'), (37.2, 'HPQ'), # (45.23, 'ACME'), (205.55, 'IBM'), # (612.78, 'AAPL')]
執(zhí)行這些計算的時候,需要注意的是 zip() 函數(shù)創(chuàng)建的是一個只能訪問一次的迭代器。 比如,下面的代碼就會產(chǎn)生錯誤:
prices_and_names = zip(prices.values(), prices.keys()) print(min(prices_and_names)) # (10.75, 'FB') print(max(prices_and_names)) # ValueError: max() arg is an empty sequence
查找兩字典的相同點
問題:怎樣在兩個字典中尋找相同點(比如相同的鍵、相同的值等等)?
解答:考慮下面兩個字典
a = { ? ? 'x' : 1, ? ? 'y' : 2, ? ? 'z' : 3 } b = { ? ? 'w' : 10, ? ? 'x' : 11, ? ? 'y' : 2 }
為了尋找兩個字典的相同點,可以簡單的在兩字典的 keys() 或者 items() 方法返回結(jié)果上執(zhí)行集合操作。比如:
# Find keys in common a.keys() & b.keys() # { 'x', 'y' } # Find keys in a that are not in b a.keys() - b.keys() # { 'z' } # Find (key,value) pairs in common a.items() & b.items() # { ('y', 2) }
這些操作也可以用于修改或者過濾字典元素。 比如,假如你想以現(xiàn)有字典構(gòu)造一個排除幾個指定鍵的新字典。 下面利用字典推導(dǎo)來實現(xiàn)這樣的需求:
# Make a new dictionary with certain keys removed c = {key:a[key] for key in a.keys() - {'z', 'w'}} # c is {'x': 1, 'y': 2}
序列中出現(xiàn)次數(shù)最多的元素
問題:怎樣找出一個序列中出現(xiàn)次數(shù)最多的元素呢?
解答:collections.Counter 類就是專門為這類問題而設(shè)計的, 它甚至有一個有用的 most_common() 方法直接給了你答案。
先假設(shè)你有一個單詞列表并且想找出哪個單詞出現(xiàn)頻率最高。你可以這樣做:
words = [ 'look', 'into', 'my', 'eyes', 'look', 'into', 'my', 'eyes', 'the', 'eyes', 'the', 'eyes', 'the', 'eyes', 'not', 'around', 'the', 'eyes', "don't", 'look', 'around', 'the', 'eyes', 'look', 'into', 'my', 'eyes', "you're", 'under' ] from collections import Counter word_counts = Counter(words) # 出現(xiàn)頻率最高的3個單詞 top_three = word_counts.most_common(3) print(top_three) # Outputs [('eyes', 8), ('the', 5), ('look', 4)]
通過某個字段將記錄分組
問題:你有一個字典或者實例的序列,然后你想根據(jù)某個特定的字段比如 date 來分組迭代訪問。
解答:itertools.groupby() 函數(shù)對于這樣的數(shù)據(jù)分組操作非常實用。 假設(shè)你已經(jīng)有了下列的字典列表:
rows = [ {'address': '5412 N CLARK', 'date': '07/01/2012'}, {'address': '5148 N CLARK', 'date': '07/04/2012'}, {'address': '5800 E 58TH', 'date': '07/02/2012'}, {'address': '2122 N CLARK', 'date': '07/03/2012'}, {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}, {'address': '1060 W ADDISON', 'date': '07/02/2012'}, {'address': '4801 N BROADWAY', 'date': '07/01/2012'}, {'address': '1039 W GRANVILLE', 'date': '07/04/2012'}, ]
現(xiàn)在假設(shè)你想在按 date 分組后的數(shù)據(jù)塊上進(jìn)行迭代。為了這樣做,你首先需要按照指定的字段(這里就是date)排序, 然后調(diào)用 itertools.groupby() 函數(shù):
from operator import itemgetter from itertools import groupby # Sort by the desired field first rows.sort(key=itemgetter('date')) # Iterate in groups for date, items in groupby(rows, key=itemgetter('date')): ? ? print(date) ? ? for i in items: ? ? ? ? print(' ', i)
運行結(jié)果:
07/01/2012
{'date': '07/01/2012', 'address': '5412 N CLARK'}
{'date': '07/01/2012', 'address': '4801 N BROADWAY'}
07/02/2012
{'date': '07/02/2012', 'address': '5800 E 58TH'}
{'date': '07/02/2012', 'address': '5645 N RAVENSWOOD'}
{'date': '07/02/2012', 'address': '1060 W ADDISON'}
07/03/2012
{'date': '07/03/2012', 'address': '2122 N CLARK'}
07/04/2012
{'date': '07/04/2012', 'address': '5148 N CLARK'}
{'date': '07/04/2012', 'address': '1039 W GRANVILLE'}
過濾序列元素
問題:你有一個數(shù)據(jù)序列,想利用一些規(guī)則從中提取出需要的值或者是縮短序列。
解答:最簡單的過濾序列元素的方法就是使用列表推導(dǎo)。比如:
mylist = [1, 4, -5, 10, -7, 2, 3, -1] [n for n in mylist if n > 0] # [1, 4, 10, 2, 3] [n for n in mylist if n < 0] # [-5, -7, -1]
有時候,過濾規(guī)則比較復(fù)雜,不能簡單的在列表推導(dǎo)或者生成器表達(dá)式中表達(dá)出來。 比如,假設(shè)過濾的時候需要處理一些異常或者其他復(fù)雜情況。這時候你可以將過濾代碼放到一個函數(shù)中, 然后使用內(nèi)建的 filter() 函數(shù)。示例如下:
values = ['1', '2', '-3', '-', '4', 'N/A', '5'] def is_int(val): try: x = int(val) return True except ValueError: return False ivals = list(filter(is_int, values)) print(ivals) # Outputs ['1', '2', '-3', '4', '5']
filter() 函數(shù)創(chuàng)建了一個迭代器,因此如果你想得到一個列表的話,就得像示例那樣使用 list() 去轉(zhuǎn)換。
轉(zhuǎn)換并同時計算數(shù)據(jù)
問題:你需要在數(shù)據(jù)序列上執(zhí)行聚集函數(shù)(比如 sum() , min() , max()), 但是首先你需要先轉(zhuǎn)換或者過濾數(shù)據(jù)
解答:一個非常優(yōu)雅的方式去結(jié)合數(shù)據(jù)計算與轉(zhuǎn)換就是使用一個生成器表達(dá)式參數(shù)。 比如,如果你想計算平方和,可以像下面這樣做:
nums = [1, 2, 3, 4, 5] s = sum(x * x for x in nums)
下面是更多的例子:
# Determine if any .py files exist in a directory import os files = os.listdir('dirname') if any(name.endswith('.py') for name in files): print('There be python!') else: print('Sorry, no python.') # Output a tuple as CSV s = ('ACME', 50, 123.45) print(','.join(str(x) for x in s)) # Data reduction across fields of a data structure portfolio = [ {'name':'GOOG', 'shares': 50}, {'name':'YHOO', 'shares': 75}, {'name':'AOL', 'shares': 20}, {'name':'SCOX', 'shares': 65} ] min_shares = min(s['shares'] for s in portfolio)
合并多個字典或映射
問題:現(xiàn)在有多個字典或者映射,你想將它們從邏輯上合并為一個單一的映射后執(zhí)行某些操作, 比如查找值或者檢查某些鍵是否存在。
解答:假如你有如下兩個字典
a = {'x': 1, 'z': 3 } b = {'y': 2, 'z': 4 }
現(xiàn)在假設(shè)你必須在兩個字典中執(zhí)行查找操作(比如先從 a 中找,如果找不到再在 b 中找)。 一個非常簡單的解決方案就是使用 collections 模塊中的 ChainMap 類。比如:
from collections import ChainMap c = ChainMap(a,b) print(c['x']) # Outputs 1 (from a) print(c['y']) # Outputs 2 (from b) print(c['z']) # Outputs 3 (from a)
到此這篇關(guān)于python3 cookbook中常遇問題解答的文章就介紹到這了,更多相關(guān)python3 cookbook問題內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)實現(xiàn)查找兩個字典相同點的方法
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)找出序列中出現(xiàn)次數(shù)最多的元素算法示例
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)篩選及提取序列中元素的方法
- Python cookbook(字符串與文本)針對任意多的分隔符拆分字符串操作示例
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)讓字典保持有序的方法
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)保存最后N個元素的方法
- Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)字典相關(guān)計算問題示例
相關(guān)文章
使用selenium和pyquery爬取京東商品列表過程解析
這篇文章主要介紹了使用selenium和pyquery爬取京東商品列表過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-08-08Python使用matplotlib繪制正弦和余弦曲線的方法示例
這篇文章主要介紹了Python使用matplotlib繪制正弦和余弦曲線的方法,結(jié)合實例形式分析了Python調(diào)用matplotlib庫進(jìn)行圖形繪制想具體操作技巧,需要的朋友可以參考下2018-01-01Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解
這篇文章主要為大家介紹了Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-07-07Python存儲json數(shù)據(jù)發(fā)生亂碼的解決方法
當(dāng)使用json.dump()把python對象轉(zhuǎn)換為json后存儲到文件中時,文件可能會出現(xiàn)亂碼的問題,本篇文章可以幫助您解決亂碼問題,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-09-09Python中的復(fù)制操作及copy模塊中的淺拷貝與深拷貝方法
淺拷貝和深拷貝是Python基礎(chǔ)學(xué)習(xí)中必須辨析的知識點,這里我們將為大家解析Python中的復(fù)制操作及copy模塊中的淺拷貝與深拷貝方法:2016-07-07