亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python 利用panda 實現(xiàn)列聯(lián)表(交叉表)

 更新時間:2021年02月06日 10:58:00   作者:賞爾  
這篇文章主要介紹了python 利用panda 實現(xiàn)列聯(lián)表(交叉表),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

交叉表(cross-tabulation,簡稱crosstab)是⼀種⽤于計算分組頻率的特殊透視表。

語法詳解:

pd.crosstab(index, # 分組依據(jù)
   columns, # 列
   values=None, # 聚合計算的值
   rownames=None, # 列名稱
   colnames=None, # 行名稱
   aggfunc=None, # 聚合函數(shù)
   margins=False, # 總計行/列
   dropna=True, # 是否刪除缺失值
   normalize=False # 
   )

1 crosstab() 實例1

1.1 讀取數(shù)據(jù)

import os
import numpy as np
import pandas as pd

file_name = os.path.join(path, 'Excel_test.xls')
df = pd.read_excel(io=file_name, # 工作簿路徑
     sheetname='透視表', # 工作表名稱
     skiprows=1, # 要忽略的行數(shù)
     parse_cols='A:D' # 讀入的列
     )
df

1.2 pd.crosstab() 默認生成以行和列分類的頻數(shù)表

pd.crosstab(df['客戶名稱'], df['產(chǎn)品類別'])

1.3 設(shè)置跟多參數(shù)實現(xiàn)分類匯總

pd.crosstab(index=df['客戶名稱'],
   columns=df['產(chǎn)品類別'],
   values=df['銷量'],
   aggfunc='sum',
   margins=True
   ).round(0).fillna(0).astype('int')

注:因為交叉表示透視表的特例,所以交叉表可以用透視表的函數(shù)實現(xiàn)。又因為透視表可以用更 python 的方式 groupby-apply 實現(xiàn),所以,交叉表完全可以用 groupby-apply 的方式實現(xiàn)。

2 用分類匯總的方法實現(xiàn) 交叉表

df.groupby(['客戶名稱', '產(chǎn)品類別']).apply(sum)

2.1 分類匯總、重新索引、設(shè)置數(shù)值格式綜合應(yīng)用

c_tbl = df.groupby(['客戶名稱', '產(chǎn)品類別']).apply(sum)['銷量'].unstack()
c_tbl['總計'] = c_tbl.sum(axis=1) # 添加總計列
c_tbl.fillna(0).round(0).astype('int')

軟件信息:

補充:使用python(pandas)將數(shù)據(jù)處理成交叉分組表

交叉分組表是匯總兩種變量數(shù)據(jù)的方法, 在很多場景可以用到, 本文會介紹如何使用pandas將包含兩個變量的數(shù)據(jù)集處理成交叉分組表.

環(huán)境

pandas

python 2.7

原理

用坐標(biāo)軸來進行比喻, 其中一個變量作為x軸, 另一個作為y軸, 如果定位到數(shù)據(jù)則累加一, 將所有數(shù)據(jù)遍歷一遍, 最后的坐標(biāo)軸就是一張交叉分組表(使用坐標(biāo)軸展示的數(shù)據(jù)一般是連續(xù)的, 交叉分組表的數(shù)據(jù)是離散的).

具體實現(xiàn)

示例數(shù)據(jù):

quality price
0  bad 18
1  bad 17
2  great  52
3  good  28
4  excellent  88
5  great  63
6  bad 8
7  good  22
8  good  68
9  excellent  98
10 great  53
11 bad 13
12 great  62
13 good  48
14 excellent  78
15 great  63
16 good  37
17 great  69
18 good  28
19 excellent  81
20 great  43
21 good  32
22 great  62
23 good  28
24 excellent  82
25 great  53

代碼:

  import pandas as pd
  from pandas import DataFrame, Series
  #生成數(shù)據(jù)
  df = DataFrame([['bad', 18], ['bad', 17], ['great', 52], ['good', 28], ['excellent', 88], ['great', 63]
        , ['bad', 8], ['good', 22], ['good', 68], ['excellent', 98], ['great', 53]
        , ['bad', 13], ['great', 62], ['good', 48], ['excellent', 78], ['great', 63]
        , ['good', 37], ['great', 69], ['good', 28], ['excellent', 81], ['great', 43]
        , ['good', 32], ['great', 62], ['good', 28], ['excellent', 82], ['great', 53]], columns = ['quality', 'price'])
#廣播使用的函數(shù)
def quality_cut(data):
  s = Series(pd.cut(data['price'], np.arange(0, 100, 10)))
  return pd.groupby(s, s).count()
#進行分組處理
df.groupby(df['quality']).apply(quality_cut)

結(jié)果:

交叉分組

詳細分析

從邏輯上來看, 為了達到對示例數(shù)據(jù)的交叉分組, 需要完成以下工作:

將數(shù)據(jù)以quality列進行分組.

將每個分組的數(shù)據(jù)分別進行cut, 以10為間隔.

將cut過的數(shù)據(jù), 以cut的范圍為列進行分組

將所有數(shù)據(jù)組合到一起, row為quality, columns為cut的范圍

步驟1, pandasgroupby(...)接口, 會按照指定的列進行分組處理, 每一個分組, 存儲相同類別的數(shù)據(jù)

<class 'pandas.core.frame.DataFrame'>
  quality price
0   bad   18
1   bad   17
6   bad   8
11   bad   13

而我們需要的, 只是price這列的數(shù)據(jù), 所以單獨將這列拿出來, 進行cut, 最后得到我們要的series(步驟2, 步驟3)

  price
(0, 10]   1
(10, 20]  3
(20, 30]  0
(30, 40]  0
(40, 50]  0
(50, 60]  0
(60, 70]  0
(70, 80]  0
(80, 90]  0

使用pandas

apply()的廣播特性, 每一個分組的數(shù)據(jù)都會經(jīng)過上述幾個步驟的處理, 最后與第一次分組row進行組合.

后記

估計能力有限, 這個問題想了很長時間, 沒想到pandas這么可以這么方便達成交叉分組的效果. 思考的時候主要是卡在數(shù)據(jù)組合上, 當(dāng)數(shù)據(jù)量很大時通過多個步驟進行數(shù)據(jù)組合, 肯定是低效而且錯誤的. 最后仔細研究了groupby, dataframe, series, dataframeIndex等數(shù)據(jù)模型, 使用廣播特性用幾句代碼就完成了. 證明了pandas的高性能, 也提醒自己遇見問題一定要耐心分析。

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • Django之編輯時根據(jù)條件跳轉(zhuǎn)回原頁面的方法

    Django之編輯時根據(jù)條件跳轉(zhuǎn)回原頁面的方法

    今天小編就為大家分享一篇Django之編輯時根據(jù)條件跳轉(zhuǎn)回原頁面的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • Python發(fā)送Email方法實例

    Python發(fā)送Email方法實例

    這篇文章主要介紹了Python發(fā)送Email的方法,有不錯的實用價值,代碼備有一定的注釋便于讀者理解,需要的朋友可以參考下
    2014-08-08
  • Python爬豆瓣電影實例

    Python爬豆瓣電影實例

    本篇文章給大家通過Python爬豆瓣電影實例對Python爬蟲更深入的講解,有興趣的學(xué)習(xí)下。
    2018-02-02
  • Python 使用 Bert 進行中文情感分析的方法

    Python 使用 Bert 進行中文情感分析的方法

    在自然語言處理(NLP)領(lǐng)域,情感分析是一個非常常見且重要的應(yīng)用,本文將帶領(lǐng)新手使用 BERT 模型進行中文情感分析,并會詳細講解如何加載開源數(shù)據(jù)集、訓(xùn)練模型、評估準(zhǔn)確度,并最終導(dǎo)出模型供未來使用,感興趣的朋友跟隨小編一起看看吧
    2024-10-10
  • Python中的字典合并與列表合并技巧

    Python中的字典合并與列表合并技巧

    這篇文章主要介紹了Python中的字典合并與列表合并技巧,下文圍繞主題展開詳細的內(nèi)容介紹,具有一的的參考價值,需要的小伙伴可以參考一下
    2022-05-05
  • python目標(biāo)檢測給圖畫框,bbox畫到圖上并保存案例

    python目標(biāo)檢測給圖畫框,bbox畫到圖上并保存案例

    這篇文章主要介紹了python目標(biāo)檢測給圖畫框,bbox畫到圖上并保存案例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • python模塊常用用法實例詳解

    python模塊常用用法實例詳解

    由于平時習(xí)慣,strftime比較常用,strptime和它是反操作。這篇文章主要介紹了python模塊常用用法,需要的朋友可以參考下
    2019-10-10
  • Python單元測試與測試用例簡析

    Python單元測試與測試用例簡析

    這篇文章主要介紹了Python單元測試與測試用例,結(jié)合簡單實例形式分析了Python單元測試相關(guān)的原理、步驟與相關(guān)注意事項,需要的朋友可以參考下
    2019-11-11
  • Python實現(xiàn)批量把SVG格式轉(zhuǎn)成png、pdf格式的代碼分享

    Python實現(xiàn)批量把SVG格式轉(zhuǎn)成png、pdf格式的代碼分享

    這篇文章主要介紹了Python實現(xiàn)批量把SVG格式轉(zhuǎn)成png、pdf格式的代碼分享,本文代碼需要引用一個第三方模塊cairosvg,需要的朋友可以參考下
    2014-08-08
  • Python3.x檢查內(nèi)存可用大小的兩種實現(xiàn)

    Python3.x檢查內(nèi)存可用大小的兩種實現(xiàn)

    本文將介紹如何使用Python 3實現(xiàn)檢查Linux服務(wù)器內(nèi)存可用大小的方法,包括使用Python標(biāo)準(zhǔn)庫實現(xiàn)和使用Linux命令實現(xiàn)兩種方式,感興趣可以了解一下
    2023-05-05

最新評論