亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python一行代碼就能實現數據分析的pandas-profiling庫

 更新時間:2024年01月30日 09:53:56   作者:程序員小寒  
這篇文章主要為大家介紹了python一行代碼就能實現數據分析的pandas-profiling庫,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪

python pandas-profiling庫

今天,我們將討論 Python 中的一個神奇的庫 pandas-profiling 。

在沒有發(fā)現這個庫之前,我很難相信可以使用一行代碼來進行探索性數據分析(EDA)。

這個 pandas-profiling 庫為你提供了一種生成給定數據幀的分析報告的方法。

生成的報告還可以保存為單獨的 HTML 和 JSON 文件

它提供了使用 pandas 加載到數據框中的任何數據集的描述性分析。這確實可以讓你免于編寫大量代碼。

在一分鐘之內,你就可以獲得整個數據集的分析報告。

下面,我們一起來看看它神奇的效果吧。

安裝庫

首先我們需要使用 pip 進行安裝。

pip install pandas
pip install pandas-profiling

加載數據集

在進行分析之前,我們需要準備一個數據集。

在這里,我們將使用房價數據集。

數據集獲取地址:

https://www.kaggle.com/competitions/house-prices-advanced-regression-techniques 

在此數據集中,總共給出了 81 個特征,包括目標特征 SalePrice。

任務是使用 80 個特征確定 SalePrice。

import pandas as pd
df = pd.read_csv("train.csv")
df.describe()

雖然 df.describe() 方法給出了特征的描述性分析,但它不如 pandas-profiling 的 ProfileReport 那么方便直觀。

現在我們將運行 pandas_profiling.ProfileReport(df) 。

from pandas_profiling import ProfileReport
reportGenerated = ProfileReport(df)
reportGenerated

你還可以使用以下命令將此報告保存為 HTML 或 JSON 格式。

reportGenerate.to_file("Analysis.html") 
reportGenerate.to_file("Analysis.json")

然后在本地瀏覽器直接打開對應的 Analysis.html 文件。

下面是生成的報告的 GIF 圖像。

在此文件的中,給出了變量計數、觀察數、重復行和缺失值的詳細信息。

之后,對于數據集中存在的每個特征,進行描述性的分析,例如有多少個不同的值,有多少個缺失值,它們對數據集中總缺失值的貢獻有多大,分位數統(tǒng)計(例如最小值), Q1、中位數、Q3、最大值、四分位距以及均值、眾數、標準差等描述性統(tǒng)計數據。

你還可以點擊 “切換詳細信息” 按鈕查看更多詳細信息。

它確實是一個非常方便的工具,可以對任何數據集進行描述性分析。

你可以在 github 上閱讀有關 pandas-profiling 項目的更多信息。

https://github.com/ydataai/ydata-profiling 

以上就是python一行代碼就能實現數據分析的pandas-profiling庫的詳細內容,更多關于python pandas-profiling庫的資料請關注腳本之家其它相關文章!

相關文章

最新評論