亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

pandas之query方法和sample隨機(jī)抽樣操作

 更新時(shí)間:2021年03月06日 08:57:24   作者:風(fēng)雪云俠  
這篇文章主要介紹了pandas之query方法和sample隨機(jī)抽樣操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧

query方法

在 pandas 中,支持把字符串形式的查詢表達(dá)式傳入 query 方法來查詢數(shù)據(jù),其表達(dá)式的執(zhí)行結(jié)果必須返回布爾列表。在進(jìn)行復(fù)雜索引時(shí),由于這種檢索方式無需像普通方法一樣重復(fù)使用 DataFrame 的名字來引用列名,一般而言會使代碼長度在不降低可讀性的前提下有所減少。

例如

In [61]: df.query('((School == "Fudan University")&'
  ....:     ' (Grade == "Senior")&'
  ....:     ' (Weight > 70))|'
  ....:     '((School == "Peking University")&'
  ....:     ' (Grade != "Senior")&'
  ....:     ' (Weight > 80))')
  ....: 
Out[61]: 
        School   Grade      Name Gender Weight Transfer
38  Peking University Freshman    Qiang Han  Male  87.0    N
66  Fudan University  Senior Chengpeng Zhou  Male  81.0    N
99  Peking University Freshman Changpeng Zhao  Male  83.0    N
131  Fudan University  Senior Chengpeng Qian  Male  73.0    Y

在 query 表達(dá)式中,幫用戶注冊了所有來自 DataFrame 的列名,所有屬于該 Series 的方法都可以被調(diào)用,和正常的函數(shù)調(diào)用并沒有區(qū)別,例如查詢體重超過均值的學(xué)生:

In [62]: df.query('Weight > Weight.mean()').head()
Out[62]: 
              School   Grade      Name Gender Weight Transfer
1        Peking University  Freshman Changqiang You  Male  70.0    N
2  Shanghai Jiao Tong University   Senior     Mei Sun  Male  89.0    N
4        Fudan University Sophomore   Gaojuan You  Male  74.0    N
10 Shanghai Jiao Tong University  Freshman  Xiaopeng Zhou  Male  74.0    N
14      Tsinghua University   Senior  Xiaomei Zhou Female  57.0    N

同時(shí),在 query 中還注冊了若干英語的字面用法,幫助提高可讀性,例如: or, and, or, is in, not in 。

例如,篩選出男生中不是大一大二的學(xué)生:

In [63]: df.query('(Grade not in ["Freshman", "Sophomore"]) and'
  ....:     '(Gender == "Male")').head()
  ....: 
Out[63]: 
              School  Grade      Name Gender Weight Transfer
2  Shanghai Jiao Tong University Senior    Mei Sun  Male  89.0    N
16      Tsinghua University Junior Xiaoqiang Qin  Male  68.0    N
17      Tsinghua University Junior   Peng Wang  Male  65.0    N
18      Tsinghua University Senior  Xiaofeng Sun  Male  71.0    N
21 Shanghai Jiao Tong University Senior Xiaopeng Shen  Male  62.0   NaN

此外,在字符串中出現(xiàn)與列表的比較時(shí), ==和!= 分別表示元素出現(xiàn)在列表和沒有出現(xiàn)在列表,等價(jià)于 is in 和 not in,例如查詢所有大三和大四的學(xué)生:

In [64]: df.query('Grade == ["Junior", "Senior"]').head()
Out[64]: 
              School  Grade      Name Gender Weight Transfer
2  Shanghai Jiao Tong University Senior    Mei Sun  Male  89.0    N
7       Tsinghua University Junior Gaoqiang Qian Female  50.0    N
9        Peking University Junior    Juan Xu Female   NaN    N
11      Tsinghua University Junior  Xiaoquan Lv Female  43.0    N
12 Shanghai Jiao Tong University Senior    Peng You Female  48.0   NaN

對于 query 中的字符串,如果要引用外部變量,只需在變量名前加 @ 符號。例如,取出體重位于70kg到80kg之間的學(xué)生:

In [65]: low, high =70, 80

In [66]: df.query('Weight.between(@low, @high)').head()
Out[66]: 
              School   Grade      Name Gender Weight Transfer
1        Peking University  Freshman Changqiang You  Male  70.0    N
4        Fudan University Sophomore   Gaojuan You  Male  74.0    N
10 Shanghai Jiao Tong University  Freshman  Xiaopeng Zhou  Male  74.0    N
18      Tsinghua University   Senior  Xiaofeng Sun  Male  71.0    N
35       Peking University  Freshman   Gaoli Zhao  Male  78.0    N

隨機(jī)抽樣

如果把 DataFrame 的每一行看作一個(gè)樣本,或把每一列看作一個(gè)特征,再把整個(gè) DataFrame 看作總體,想要對樣本或特征進(jìn)行隨機(jī)抽樣就可以用 sample 函數(shù)。有時(shí)在拿到大型數(shù)據(jù)集后,想要對統(tǒng)計(jì)特征進(jìn)行計(jì)算來了解數(shù)據(jù)的大致分布,但是這很費(fèi)時(shí)間。

同時(shí),由于許多統(tǒng)計(jì)特征在等概率不放回的簡單隨機(jī)抽樣條件下,是總體統(tǒng)計(jì)特征的無偏估計(jì),比如樣本均值和總體均值,那么就可以先從整張表中抽出一部分來做近似估計(jì)。

sample 函數(shù)中的主要參數(shù)為 n, axis, frac, replace, weights ,前三個(gè)分別是指抽樣數(shù)量、抽樣的方向(0為行、1為列)和抽樣比例(0.3則為從總體中抽出30%的樣本)。

replace 和 weights 分別是指是否放回和每個(gè)樣本的抽樣相對概率,當(dāng) replace = True 則表示有放回抽樣。例如,對下面構(gòu)造的 df_sample 以 value 值的相對大小為抽樣概率進(jìn)行有放回抽樣,抽樣數(shù)量為3。

In [67]: df_sample = pd.DataFrame({'id': list('abcde'),
  ....:              'value': [1, 2, 3, 4, 90]})
  ....:

In [68]: df_sample
Out[68]: 
 id value
0 a   1
1 b   2
2 c   3
3 d   4
4 e   90

In [69]: df_sample.sample(3, replace = True, weights = df_sample.value)
Out[69]: 
 id value
4 e   90
4 e   90
4 e   90

補(bǔ)充:pandas.DataFrame.sample 隨機(jī)選取若干行

1、數(shù)據(jù)切片選取

1.1 pandas.DataFrame.sample 隨機(jī)選取若干行

1.1.1 功能說明

有時(shí)候我們只需要數(shù)據(jù)集中的一部分,并不需要全部的數(shù)據(jù)。這個(gè)時(shí)候我們就要對數(shù)據(jù)集進(jìn)行隨機(jī)的抽樣。pandas中自帶有抽樣的方法。

功能相似:numpy.random.choice

Generates a random sample from a given 1-D numpy array.

1.1.2 使用說明

1.函數(shù)名及功能

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]

2.輸入?yún)?shù)說明

參數(shù)名稱 參數(shù)說明 舉例說明
n 要抽取的行數(shù)

df.sample(n=3,random_state=1)
提取3行數(shù)據(jù)列表
注意,使用random_state,以確??芍貜?fù)性的例子。

frac

抽取行的比例
例如frac=0.8,就是抽取其中80%。

df.sample(frac=0.8, replace=True, random_state=1)
replace

是否為有放回抽樣,
True:有放回抽樣
False:未放回抽樣

True:取行數(shù)據(jù)后,可以重復(fù)放回后再取
False:取行數(shù)據(jù)后不放回,下次取其它行數(shù)據(jù)
注意:當(dāng)N>總數(shù)據(jù)容量,replace設(shè)置為值時(shí)有效

weights

字符索引或概率數(shù)組

axis=0:為行字符索引或概率數(shù)組
axis=1:為列字符索引或概率數(shù)組

random_state

int: 隨機(jī)數(shù)發(fā)生器種子
或numpy.random.RandomState

random_state=None,取得數(shù)據(jù)不重復(fù)
random_state=1,可以取得重復(fù)數(shù)據(jù)

axis

選擇抽取數(shù)據(jù)的行還是列
axis=0:抽取行
axis=1:抽取列

也就是說axis=1時(shí),在列中隨機(jī)抽取n列,在axis=0時(shí),在行中隨機(jī)抽取n行。

3. 返回值說明

返回選擇的N行元素的DataFrame對象。

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • Pyqt5 關(guān)于流式布局和滾動條的綜合使用示例代碼

    Pyqt5 關(guān)于流式布局和滾動條的綜合使用示例代碼

    這篇文章主要介紹了Pyqt5 關(guān)于流式布局和滾動條的綜合使用示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-03-03
  • Python裝飾器的定義和使用詳情

    Python裝飾器的定義和使用詳情

    這篇文章主要介紹了Python裝飾器的定義和使用詳情,裝飾器給已有函數(shù)增加額外的功能的函數(shù),本質(zhì)上是一個(gè)閉包函數(shù),下文更多相關(guān)介紹需要的小伙伴可以參考一下
    2022-04-04
  • 淺談python中常用的excel模塊庫

    淺談python中常用的excel模塊庫

    本文主要介紹了python中常用的excel模塊庫,感興趣的同學(xué),可以參考下。
    2021-06-06
  • Python3 實(shí)現(xiàn)串口兩進(jìn)程同時(shí)讀寫

    Python3 實(shí)現(xiàn)串口兩進(jìn)程同時(shí)讀寫

    今天小編就為大家分享一篇Python3 實(shí)現(xiàn)串口兩進(jìn)程同時(shí)讀寫,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • python GUI庫圖形界面開發(fā)之PyQt5拖放控件實(shí)例詳解

    python GUI庫圖形界面開發(fā)之PyQt5拖放控件實(shí)例詳解

    這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5使用拖放控件實(shí)例詳解,需要的朋友可以參考下
    2020-02-02
  • Python3自動安裝第三方庫,跟pip說再見

    Python3自動安裝第三方庫,跟pip說再見

    很多朋友私信小編Python安裝第三方庫安裝技巧,在這就不一一回復(fù)大家了,今天小編給大家分享一篇教程關(guān)于Python自動安裝第三方庫的小技巧,本文以安裝plotly為例給大家詳細(xì)講解,感興趣的朋友跟隨小編一起看看吧
    2021-10-10
  • 深入理解Python中的內(nèi)置函數(shù)map

    深入理解Python中的內(nèi)置函數(shù)map

    在Python中,map是一個(gè)非常實(shí)用的內(nèi)置函數(shù),它允許你對一個(gè)序列的所有元素執(zhí)行特定的操作,map函數(shù)的結(jié)果可以被轉(zhuǎn)換為一個(gè)列表,或者其他的可迭代對象,在本文中,我們將深入探討map函數(shù)的用法及其在實(shí)際編程中的應(yīng)用
    2023-06-06
  • centos6.7安裝python2.7.11的具體方法

    centos6.7安裝python2.7.11的具體方法

    下面小編就為大家?guī)硪黄猚entos6.7安裝python2.7.11的具體方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-01-01
  • 詳解Python的Flask框架中生成SECRET_KEY密鑰的方法

    詳解Python的Flask框架中生成SECRET_KEY密鑰的方法

    密鑰值的生成功能十分重要,幾乎也是各大Web開發(fā)框架的標(biāo)配,Flask當(dāng)然也不例外,這里我們就來詳解Python的Flask框架中生成SECRET_KEY密鑰的方法
    2016-06-06
  • Python基于回溯法子集樹模板實(shí)現(xiàn)圖的遍歷功能示例

    Python基于回溯法子集樹模板實(shí)現(xiàn)圖的遍歷功能示例

    這篇文章主要介紹了Python基于回溯法子集樹模板實(shí)現(xiàn)圖的遍歷功能,結(jié)合實(shí)例形式分析了Python使用回溯法子集樹模板針對圖形遍歷問題的相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下
    2017-09-09

最新評論