pandas計(jì)數(shù) value_counts()的使用
在pandas里面常用value_counts確認(rèn)數(shù)據(jù)出現(xiàn)的頻率。
1. Series 情況下:
pandas 的 value_counts() 函數(shù)可以對Series里面的每個(gè)值進(jìn)行計(jì)數(shù)并且排序。
import pandas as pd df = pd.DataFrame({'區(qū)域' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '10月份銷售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'], '9月份銷售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']}) print(df)
統(tǒng)計(jì)每個(gè)區(qū)域出現(xiàn)多少次:
print(df['區(qū)域'].value_counts())
每個(gè)區(qū)域都被計(jì)數(shù),并且默認(rèn)從高到低排序。
如果想升序排列,設(shè)置參數(shù) ascending = True:
print(df['區(qū)域'].value_counts(ascending=True))
如果想得出計(jì)數(shù)占比,可以加參數(shù) normalize=True
print(df['區(qū)域'].value_counts(normalize=True))
注:空值默認(rèn)剔除掉的。value_counts()返回的結(jié)果是一個(gè)Series數(shù)組,可以跟別的數(shù)組進(jìn)行計(jì)算。
2. DataFrame 情況下:
import pandas as pd df = pd.DataFrame({'區(qū)域1' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '區(qū)域2' : ['太原', '太原', '西安', '西安', '西安', '太原']}) print(df.apply(pd.value_counts))
區(qū)域2中沒有鄭州,所以是NaN。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python3使用tracemalloc實(shí)現(xiàn)追蹤mmap內(nèi)存變化
這篇文章主要為大家詳細(xì)介紹了在Python3中如何使用tracemalloc實(shí)現(xiàn)追蹤mmap內(nèi)存變化,文中的示例代碼講解詳細(xì),感興趣的可以了解一下2023-03-03python計(jì)算階乘的兩個(gè)函數(shù)用法
這篇文章主要介紹了python計(jì)算階乘的兩個(gè)函數(shù)用法,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05pytorch中的優(yōu)化器optimizer.param_groups用法
這篇文章主要介紹了pytorch中的優(yōu)化器optimizer.param_groups用法,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05Python兩臺(tái)電腦實(shí)現(xiàn)TCP通信的方法示例
這篇文章主要介紹了Python兩臺(tái)電腦實(shí)現(xiàn)TCP通信的方法示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-05-05詳解Python查找算法的實(shí)現(xiàn)(線性,二分,分塊,插值)
這篇文章主要為大家介紹了Python中常見的四種查找算法的實(shí)現(xiàn):線性、二分、分塊和插值,文中通過圖片詳細(xì)講解了它們實(shí)現(xiàn)的原理與代碼,需要的可以參考一下2022-04-04