快捷導(dǎo)航

Python pandas如何根據(jù)指定條件篩選數(shù)據(jù)

更新時(shí)間：2024年02月22日 09:07:35 作者：永遠(yuǎn)在減肥永遠(yuǎn)110的的小潘

這篇文章主要介紹了Python pandas如何根據(jù)指定條件篩選數(shù)據(jù)問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教

pandas根據(jù)指定條件篩選數(shù)據(jù)

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])

1、篩選出"sh"列大于5的數(shù)據(jù)

法一：直接篩選

適用于一些比較簡(jiǎn)單直接的篩選，這種方式方便快捷。

df[df["sh"]>5]

法二：函數(shù)篩選

適用于比較復(fù)雜的條件篩選，函數(shù)除了可以使用lambda匿名函數(shù)以外，也可以使用其他邏輯更復(fù)雜的自定義函數(shù)。

df[df["sh"].map(lambda x:x>5)]

2、篩選出"sh"列為2或7的數(shù)據(jù)

法一：同上

df[df["sh"]==5]

法二：同上

df[df["sh"].map(lambda x:x==5)]

法三：使用isin()函數(shù),支持多值篩選

df[df["sh"].isin([5])]

3、模糊篩選

1）str.contains()函數(shù)

province = pd.DataFrame(['廣東', '廣西', '福建', '福建省'], columns=['省份'])
province.loc[province["省份"].str.contains("福")]#篩選出福建省數(shù)據(jù)

2）正則匹配

import re
province = pd.DataFrame(['廣東', '廣西', '福建', '福建省'], columns=['省份'])
#自定義函數(shù)，如果包含“廣”字，則返回True,否則返回False
def func(x):
    if re.search(".*廣.*",x):
        return(True)
    else:
        return(False)
province[province["省份"].apply(func)]

3）切片

df=pd.DataFrame({"date":["2020efgdh0228","2021hijik0228","2019hokh0201"],"value":[9999,777,4]})

#篩選出2019年的數(shù)據(jù)
df[df["date"].map(lambda x:x[0:4])=="2019"]

4、篩選重復(fù)值

df[df.duplicated(subset=["one"],keep="last")]#返回除最后一次出現(xiàn)的重復(fù)值

df[df.duplicated(subset=["one"],keep=False)]#返回所有重復(fù)值

總結(jié)

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

一文教會(huì)你用Python獲取網(wǎng)頁(yè)指定內(nèi)容
Python用做數(shù)據(jù)處理還是相當(dāng)不錯(cuò)的,如果你想要做爬蟲,Python是很好的選擇,它有很多已經(jīng)寫好的類包,只要調(diào)用即可完成很多復(fù)雜的功能,下面這篇文章主要給大家介紹了關(guān)于Python獲取網(wǎng)頁(yè)指定內(nèi)容的相關(guān)資料,需要的朋友可以參考下
2022-03-03
Tensorflow實(shí)現(xiàn)酸奶銷量預(yù)測(cè)分析
這篇文章主要為大家詳細(xì)介紹了Tensorflow酸奶銷量預(yù)測(cè)分析，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2019-07-07
python3讀取excel文件只提取某些行某些列的值方法
今天小編就為大家分享一篇python3讀取excel文件只提取某些行某些列的值方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2018-07-07
python 三元運(yùn)算符使用解析
這篇文章主要介紹了python 三元運(yùn)算符使用解析,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2019-09-09
Python 字符串操作詳情
這篇文章主要介紹了Python 字符串操作，所謂字符串，就是由0個(gè)或者多個(gè)字符組成的有限序列，字符串的字符可以是特殊符號(hào)、英文字母、中文字符、日文的平假名或片假名、希臘字母、Emoji字符等等。下面我們大家一起來學(xué)習(xí)文章詳細(xì)內(nèi)容吧
2021-11-11
python根據(jù)字典的鍵來刪除元素的方法
在本篇文章里小編給大家整理的是一篇關(guān)于python根據(jù)字典的鍵來刪除元素的方法，有興趣的朋友們可以參考下。
2020-08-08
python機(jī)器學(xué)習(xí)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)示例解析
這篇文章主要為大家介紹了python機(jī)器學(xué)習(xí)python實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的示例解析，在同樣在進(jìn)行python機(jī)器學(xué)習(xí)的同學(xué)可以借鑒參考下，希望能夠有所幫助
2021-10-10
Python中True(真)和False(假)判斷詳解
眾所周知True和False是一個(gè)布爾變量可取的值,下面這篇文章主要給大家介紹了關(guān)于Python中True(真)和False(假)判斷的相關(guān)資料,本文通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
2022-07-07
Python線程同步的實(shí)現(xiàn)代碼
本文介紹了threading 模塊提供的線程同步原語(yǔ)包括：Lock、RLock、Condition、Event、Semaphore等對(duì)象。對(duì)大家的學(xué)習(xí)具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友可以參考下
2018-10-10
Python正則獲取、過濾或者替換HTML標(biāo)簽的方法
這篇文章主要介紹了Python通過正則表達(dá)式獲取、過濾或者替換HTML標(biāo)簽的方法，感興趣的小伙伴們可以參考一下
2016-01-01