Pandas中describe()函數的具體使用
先附上官方文檔:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html
describe()有三個參數:
DataFrame.describe(percentiles=None, include=None, exclude=None) # return:Series or DataFrame. Summary statistics of the Series or Dataframe provided.
幾個要點:
1.include=‘all’,代表對所有列進行統(tǒng)計,如果不加這個參數,則只對數值列進行統(tǒng)計
datafile.describe(include='all')
沒加參數的少了height列(height為離散型變量,其余為數值型):
加了參數include=‘all’,出現height變量:
2.統(tǒng)計變量說明:
- count:數量統(tǒng)計,此列共有多少有效值
- unipue:不同的值有多少個
- std:標準差
- min:最小值
- 25%:四分之一分位數
- 50%:二分之一分位數
- 75%:四分之三分位數
- max:最大值
- mean:均值
3.僅僅顯示離散型變量:include=[‘O’]
df.describe(include=['O'])
只顯示了height列:
4.第一個percentiles,這個參數可以設定數值型特征的統(tǒng)計量,默認[.25, .5, .75],返回25%,50%,75%時候的數據,可修改參數,**如:
df.describe(percentiles=[.10, .75, .8])
5.第三個參數可以指定不選擇哪些列。
例如
df.describe(exclude=['O'])
height列沒有了:
到此這篇關于Pandas中describe()函數的具體使用的文章就介紹到這了,更多相關Pandas describe()內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
tensorflow使用range_input_producer多線程讀取數據實例
今天小編就為大家分享一篇tensorflow使用range_input_producer多線程讀取數據實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01python 在右鍵菜單中加入復制目標文件的有效存放路徑(單斜杠或者雙反斜杠)
這篇文章主要介紹了python 在右鍵菜單中加入復制目標文件的有效存放路徑(單斜杠或者雙反斜杠),本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-04-04python 循環(huán)讀取txt文檔 并轉換成csv的方法
今天小編就為大家分享一篇python 循環(huán)讀取txt文檔 并轉換成csv的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-10-10