快捷導航

Python中的map()、apply()、applymap()的區(qū)別小結(jié)

更新時間：2023年10月26日 09:14:03 作者：對許

map()、apply()和applymap()方法是Python中常用的轉(zhuǎn)換方法,,輸出的結(jié)果及類型完全取決于作為給定方法的參數(shù)的函數(shù),本文就來介紹一下這三種方法的區(qū)別,具有一定的參考價值,感興趣的可以了解一下

1、實驗背景

Pandas庫被廣泛用于數(shù)據(jù)處理和分析。map()、apply()和applymap()方法是Python中常用的轉(zhuǎn)換方法，輸出的結(jié)果及類型完全取決于作為給定方法的參數(shù)的函數(shù)

在日常數(shù)據(jù)處理過程中，會經(jīng)常遇到這樣的情況，對一個DataFrame進行逐行/逐列、多行/多列或逐元素的操作，很多同學可能知道需要用到map()、apply()或者applymap()，但是不知道什么情況下用哪種方法

本文將通過一個小實驗來探討Python中的map()、apply()和applymap()的區(qū)別和使用場景，并得出結(jié)論

2、實驗過程

數(shù)據(jù)準備：

import numpy as np
import pandas as pd

df = pd.DataFrame({'A': [1, 4, 7], 'B': [2, 5, 8], 'C': [3, 6, 9]})
print(df)
'''
   A  B  C
0  1  2  3
1  4  5  6
2  7  8  9
'''

map()、apply()和applymap()區(qū)別演示：

1）map()

map(func, *iter)：Python內(nèi)置高級函數(shù)，用于對一個或多個可迭代序列的每個元素執(zhí)行函數(shù)func，例如Series

# 基本使用
df['D'] = list(map(lambda a, b: a + b, df.A, df.B))
print(df)
'''
   A  B  C   D
0  1  2  3   3
1  4  5  6   9
2  7  8  9  15
'''
df['E'] = list(map(lambda a, b: [a, b], df.A, df.B))
print(df)
'''
   A  B  C   D       E
0  1  2  3   3  [1, 2]
1  4  5  6   9  [4, 5]
2  7  8  9  15  [7, 8]
'''

# 應(yīng)用多個函數(shù)收集：對A、B兩列應(yīng)用求平均和求和函數(shù)，將結(jié)果收集到列表
df['F'] = [list(map(lambda f: f(a, b), [lambda x, y: (x+y)/2, lambda x, y: x+y])) for a, b in zip(df.A, df.B)]
print(df)
'''
   A  B  C   D       E          F
0  1  2  3   3  [1, 2]   [1.5, 3]
1  4  5  6   9  [4, 5]   [4.5, 9]
2  7  8  9  15  [7, 8]  [7.5, 15]
'''

2）apply()

apply(func, axis=0)：Pandas DataFrame/Series對象的方法，對df某一列/多列或某一行/多行中的元素執(zhí)行函數(shù)func，默認axis=0為列

# 對某一列的每個元素執(zhí)行函數(shù)
df['D'] = df['A'].apply(lambda e: e ** 2)
# 對指定多列的每個元素執(zhí)行函數(shù)
df[['E', 'F']] = df[['A', 'B']].apply(lambda e: -e)
# 對某一行的每個元素執(zhí)行函數(shù)
# 除了pd.concat()，在原df基礎(chǔ)上增量追加一行可使用如下方式（不能使用該方式添加多行）
df.loc[3] = df.loc[0].apply(lambda e: e ** 2)
# 對指定多行的每個元素執(zhí)行函數(shù)
df = pd.concat([df, df.loc[0: 1, :].apply(lambda e: -e)], ignore_index=True)
print(df)
'''
   A  B  C   D  E  F
0  1  2  3   1 -1 -2
1  4  5  6  16 -4 -5
2  7  8  9  49 -7 -8
3  1  4  9   1  1  4
4 -1 -2 -3  -1  1  2
5 -4 -5 -6 -16  4  5
'''
 
# 對所有列分別計算sum
# df.index.values[-1]：獲取最后一個索引值
df.loc[df.index.values[-1]+1] = df.apply(np.sum)
print(df)
'''
    A   B   C
0   1   2   3
1   4   5   6
2   7   8   9
3  12  15  18
'''
# 對所有行分別計算sum
df['sum'] = df.apply(np.sum, axis=1)
print(df)
'''
   A  B  C  sum
0  1  2  3    6
1  4  5  6   15
2  7  8  9   24
'''
# 對DataFrame每個元素執(zhí)行函數(shù)
print(df.apply(lambda e: e + 1))
'''
   A  B   C
0  2  3   4
1  5  6   7
2  8  9  10
'''

3）applymap()

applymap(func)/df.map(func)：Pandas DataFrame對象的方法，Series不支持，用于對df的每個元素執(zhí)行函數(shù)func，且將來會被df.map()替換

在使用Series對象執(zhí)行時報錯如下：

AttributeError: 'Series' object has no attribute 'applymap'

在使用DataFrame對象執(zhí)行時警告如下：

FutureWarning: DataFrame.applymap has been deprecated. Use DataFrame.map instead.

print(df.applymap(lambda e: e + 1))
print(df.map(lambda e: e + 1))
'''
   A  B   C
0  2  3   4
1  5  6   7
2  8  9  10
'''

3、實驗結(jié)論

1） map(func, *iter)是Python內(nèi)置高級函數(shù)，可以直接調(diào)用，用于對一個或多個可迭代序列的每個元素執(zhí)行函數(shù)

2） apply(func, axis=0)是DataFrame/Series對象的方法，用于對df某一列(Series)/多列或某一行(Series)/多行中的每個元素執(zhí)行函數(shù)

3） applymap(func)僅是DataFrame對象的方法，不支持Series，不能指定軸axis，用于對df的每個元素執(zhí)行函數(shù)，且將來會被df.map()替換

4）在對DataFrame或Series運用apply()、applymap()的時候，必須保證所有的字段類型與函數(shù)的參數(shù)及結(jié)果一致

到此這篇關(guān)于Python中的map()、apply()、applymap()的區(qū)別小結(jié)的文章就介紹到這了,更多相關(guān)Python map()、apply()、applymap()內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: