亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

pandas按條件篩選數(shù)據(jù)的實現(xiàn)

 更新時間:2021年02月20日 11:35:16   作者:Sun_Sherry  
這篇文章主要介紹了pandas按條件篩選數(shù)據(jù)的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

pandas中對DataFrame篩選數(shù)據(jù)的方法有很多的,以后會后續(xù)進行補充,這里只整理遇到錯誤的情況。

1.使用布爾型DataFrame對數(shù)據(jù)進行篩選

使用一個條件對數(shù)據(jù)進行篩選,代碼類似如下:

num_red=flags[flags['red']==1]

使用多個條件對數(shù)據(jù)進行篩選,代碼類似如下:

stripes_or_bars=flags[(flags['stripes']>=1) | (flags['bars']>=1)]

常見的錯誤代碼如下:

代碼一:

stripes_or_bars=flags[flags['stripes']>=1 or flags['bars']>=1]

代碼二:

stripes_or_bars=flags[flags['stripes']>=1 | flags['bars']>=1].

代碼三:

stripes_or_bars=flags[(flags['stripes']>=1) or (flags['bars']>=1)]

以上這三種代碼的錯誤提示都是:ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 中括號里面的邏輯式如何解析的暫時不清楚。貌似不能使用and、or及not。

除了使用組合的邏輯表達式之外,使用返回類型為布爾型值的函數(shù)也可以達到篩選數(shù)據(jù)的效果。示例如下:

import pandas as pd
import numpy as np
df=pd.DataFrame(np.array(range(10)).reshape((5,-1)))
df.columns=['0','1']
df=df[df['1'].isin([3,5,9])]

 其df的結果如下:

2.iloc()方法、ix()方法和iloc()方法的區(qū)別

首先dataframe一般有兩種類型的索引:第一種是位置索引,即dataframe自帶的從0開始的索引,這種索引叫位置索引。另一種即標簽索引,這種索引是你在創(chuàng)建datafram時通過index關鍵字,或者通過其他index相關方法重新給dataframe設置的索引。這兩種索引是同時存在的。一般設置了標簽索引之后,就不在顯示位置索引,但不意味著位置索引就不存在了。

假設有如下幾行數(shù)據(jù)(截圖部分只是數(shù)據(jù)的一部分),很明顯,以下顯示的索引為標簽索引。同時574(標簽索引)行對應的位置索引則為0,1593行對應的位置索引為2, 以此類推。

先來看loc(),其API網(wǎng)址http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.htm,函數(shù)名下方有一行解釋,Access a group of rows and columns by label(s) or a boolean array.. loc[] is primarily label based, but may also be used with a boolean array. 

代碼一:

first_listing = normalized_listings.loc[[0,4]]

結果如下,可以看出其輸出的是dataframe中標簽索引為0和4的兩行數(shù)據(jù)。注意,如果標簽索引的類型為字符串,則在loc中也要用字符串的形式。

再來看iloc(),其API網(wǎng)址http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iloc.html,函數(shù)名下方的解釋為 Purely integer-location based indexing for selection by position. .iloc[] is primarily integer position based ( from 0 to length-1 of the axis), but may also be used with a boolean array.

代碼二:

first_listing = normalized_listings.iloc[[0,4]]

結果如下,可以看出其輸出的dataframe中第0行和第4行的數(shù)據(jù),即按方法是按照位置索引取得數(shù)。注意使用位置索引的時候只能用整數(shù)(integer position,bool類型除外)

另外,還可以向loc和iloc中傳入bool序列,這樣就可以將前面介紹的boo表達式用到loc和iloc中。下面來看看怎么使用bool序列?

import pandas as pd
data=pd.DataFrame(data={'col1':[1,2,3,5,10],'col2':[50,90,67,75,100]},\
         index=['a','b','c','d','e'])
print(data)
#iloc[]示例,iloc似乎不能直接使用邏輯表達式的結果,我這里將其轉(zhuǎn)置成list之后就可以用了,原因暫且不明
data_1=data.iloc[list(data['col1']>5)]
print(data_1)
#loc[]示例,loc中可以直接使用邏輯表達式
data_2=data.loc[data['col1']>5]
print(data_2)

在iloc[]中,如果直接使用loc中的邏輯表達式而不進行l(wèi)ist()轉(zhuǎn)化的話,會提示ValueError: iLocation based boolean indexing cannot use an indexable as a mask錯誤。

如果查看上述兩段代碼中得到的first_listing。我們會發(fā)現(xiàn)兩處first_listing的類型均為datafrarm。loc和iloc除了能對行進行篩選,還可以篩選列。如果在loc和iloc中設定了對列的篩選,則篩選之后得到的數(shù)據(jù)可能是datafrme類型,也有可能是Series類型。下面直接以代碼運行結果進行說明。

import pandas as pd
data=pd.DataFrame(data={'col1':[1,2,3,5,10],'col2':[50,90,67,75,100]},\
         index=['a','b','c','d','e'])
print(data)
#iloc[]示例 ,在使用iloc的時候,[]里面無論是篩選行還是篩選列,都只能使用數(shù)字形式的行號或列號。
#這里如果使用‘col2',這里會報錯
data_1=data.iloc[[0,4],[1]]#當需要篩選出多列或者希望返回的結果為DataFrame時,可以將列號用[]括起來。
print(data_1)
print(type(data_1))
data_2=data.iloc[[0,4],1]#當只需要篩選出其中的一列時可以只寫一個列號,不加中括號,這種方法得到的是一個Series
print(data_2)
print(type(data_2))
#loc[]示例
data_3=data.loc[['a','e'],['col2']]
print(data_3)
print(type(data_3))
data_4=data.loc[['a','e'],'col2']
print(data_4)
print(type(data_4))

具體的代碼執(zhí)行結果如下:

最后看ix()方法,其API網(wǎng)址http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.ix.html,其解釋為 A primarily label-location based indexer, with integer position fallback.

代碼三:

first_listing = normalized_listings.ix[[0,4]]

結果如下似乎與loc()方法的結果是相同的,但是從其給出的解釋來看,其好像是前兩個方法的集合。

到此這篇關于pandas按條件篩選數(shù)據(jù)的實現(xiàn)的文章就介紹到這了,更多相關pandas 條件篩選 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • python-docx文檔格式修改方式

    python-docx文檔格式修改方式

    使用python-docx庫修改docx文檔格式的兩種方法:第一種是通過自定義函數(shù)設置段落和字體樣式,第二種是預設Word中的樣式后通過代碼替換文檔整體樣式。這兩種方式各有優(yōu)缺點,第一種方法更靈活,而第二種方法可以更全面地保留格式細節(jié)
    2024-09-09
  • pycharm運行程序時出現(xiàn)Run‘python tests for XXX.py‘問題及解決

    pycharm運行程序時出現(xiàn)Run‘python tests for XXX.py‘問題及

    這篇文章主要介紹了pycharm運行程序時出現(xiàn)Run ‘python tests for XXX.py‘問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • 學會python操作excel永不加班系列

    學會python操作excel永不加班系列

    這篇文章主要介紹了python操作excel的詳解,,需要的朋友可以參考下,小編覺得這篇文章寫的還不錯,希望能夠給你帶來幫助
    2021-11-11
  • Python asyncio的基本使用示例教程

    Python asyncio的基本使用示例教程

    Task主要作用是幫助event_loop調(diào)度,如果Task發(fā)現(xiàn)它打包的協(xié)程在await一個對象(執(zhí)行一個io操作),則Task會掛起該協(xié)程的執(zhí)行,把控制權交回event_loop,讓他去運行其他Task,當該對象運行完畢,Task將打包的協(xié)程恢復運行,本文介紹Python asyncio使用小結,感興趣的朋友一起看看吧
    2024-02-02
  • Python實現(xiàn)圖的廣度和深度優(yōu)先路徑搜索算法

    Python實現(xiàn)圖的廣度和深度優(yōu)先路徑搜索算法

    圖是一種抽象數(shù)據(jù)結構,本質(zhì)和樹結構是一樣的。圖與樹相比較,圖具有封閉性,可以把樹結構看成是圖結構的前生。本文將利用Python實現(xiàn)圖的廣度和深度優(yōu)先路徑搜索算法,感興趣的可以學習一下
    2022-04-04
  • ?Python列表的切片取值詳解

    ?Python列表的切片取值詳解

    這篇文章主要介紹了?Python列表的切片取值詳解,文章通過圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-09-09
  • 一行Python代碼制作動態(tài)二維碼的實現(xiàn)

    一行Python代碼制作動態(tài)二維碼的實現(xiàn)

    這篇文章主要介紹了一行Python代碼制作動態(tài)二維碼的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-09-09
  • Python 讀取串口數(shù)據(jù),動態(tài)繪圖的示例

    Python 讀取串口數(shù)據(jù),動態(tài)繪圖的示例

    今天小編就為大家分享一篇Python 讀取串口數(shù)據(jù),動態(tài)繪圖的示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • python 與GO中操作slice,list的方式實例代碼

    python 與GO中操作slice,list的方式實例代碼

    這篇文章主要介紹了python 與GO中操作slice,list的方式實例代碼的相關資料,需要的朋友可以參考下
    2017-03-03
  • Python三數(shù)之和的實現(xiàn)方式

    Python三數(shù)之和的實現(xiàn)方式

    這篇文章主要介紹了Python三數(shù)之和的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05

最新評論