python?Sweetviz探索性數(shù)據(jù)可視化分析庫使用特征詳解
python Sweetviz庫
今天給大家分享一個(gè)神奇的 python 庫,Sweetviz。
https://github.com/fbdesignpro/sweetviz
探索性數(shù)據(jù)分析是一個(gè)我們傾向于使用可視化方法來分析數(shù)據(jù)集并總結(jié)數(shù)據(jù)集主要特征的過程。
EDA 非常重要,因?yàn)槿绻悴皇煜ふ谔幚淼臄?shù)據(jù)集,那么你將無法從該數(shù)據(jù)中推斷出某些內(nèi)容。然而,EDA通常需要花費(fèi)大量時(shí)間。
但是,如果我告訴你 python 可以在一些庫的幫助下自動(dòng)化 EDA 過程呢?
在本文中,我們將使用 「Sweetviz」 實(shí)現(xiàn) EDA 自動(dòng)化。
它是一個(gè) Python 庫,可以生成「漂亮的高密度可視化」效果,從而通過一行代碼啟動(dòng) EDA(探索性數(shù)據(jù)分析)。輸出是一個(gè)完全獨(dú)立的 HTML 應(yīng)用程序。
該系統(tǒng)是圍繞快速可視化目標(biāo)值和比較數(shù)據(jù)集而構(gòu)建的。其目標(biāo)是幫助快速分析目標(biāo)特征、訓(xùn)練與測(cè)試數(shù)據(jù)以及其他此類數(shù)據(jù)表征任務(wù)。
安裝庫
與任何其他 python 庫一樣,我們可以使用下面給出的 pip install 命令來安裝 sweetviz。
pip install sweetviz
分析數(shù)據(jù)集
讓我們使用來自 Kaggle 的鳶尾花數(shù)據(jù)集。
你可以從此處下載數(shù)據(jù)集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)
# Import sweetviz and pandas libraries import sweetviz as sv import pandas as pd # Now read the dataset using pd.read_csv() function data = pd.read_csv('IRIS.csv') # Split first 125 entries/rows into train data frame train = data.iloc[:125] # Split next rows from 125 until end into test data frame test = data.iloc[125:]
現(xiàn)在你可以使用 show_html() 方法將數(shù)據(jù)框的分析結(jié)果顯示為 HTML 文件。
report=sv.analyze(train) report.show_html()
現(xiàn)在,如果你想比較兩個(gè)數(shù)據(jù)幀(即訓(xùn)練集、測(cè)試集)之間的分析,你可以使用 sweetviz 庫中的 compare() 函數(shù)。
compare_report=sv.compare(train,test) compare_report.show_html()
如果你想比較兩個(gè)子群體之間的分析,那么你可以使用 sweetviz 庫中的 compare_intra() 函數(shù)。
請(qǐng)注意,在內(nèi)部,這會(huì)創(chuàng)建 2 個(gè)單獨(dú)的數(shù)據(jù)框來表示每個(gè)結(jié)果組。
compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other']) compare_intra_report.show_html()
更多的功能期待大家去嘗試,以上就是python Sweetviz探索性數(shù)據(jù)可視化分析庫使用特征詳解的詳細(xì)內(nèi)容,更多關(guān)于python Sweetviz庫的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- Python Sweetviz輕松實(shí)現(xiàn)探索性數(shù)據(jù)分析
- python一行代碼就能實(shí)現(xiàn)數(shù)據(jù)分析的pandas-profiling庫
- Python數(shù)據(jù)分析庫PyGWalker的強(qiáng)大交互式功能界面探索
- 精選39道Python數(shù)據(jù)分析面試題提早備戰(zhàn)金三銀四
- Python數(shù)據(jù)分析從入門到進(jìn)階之分類算法全面教程
- 科學(xué)計(jì)算與數(shù)據(jù)分析利器Python數(shù)據(jù)分析庫Scipy使用詳解
- Python數(shù)據(jù)分析numpy文本數(shù)據(jù)讀取索引切片實(shí)例詳解
- Python數(shù)據(jù)分析numpy的Nan和Inf使用注意點(diǎn)詳解
- Python數(shù)據(jù)分析pandas之布爾索引使用詳解
相關(guān)文章
Python?PyQt5中窗口數(shù)據(jù)傳遞的示例詳解
開發(fā)應(yīng)用程序時(shí),若只有一個(gè)窗口則只需關(guān)心這個(gè)窗口里面的各控件之間如何傳遞數(shù)據(jù)。如果程序有多個(gè)窗口,就要關(guān)心不同的窗口之間是如何傳遞數(shù)據(jù)。本文介紹了PyQt5中三種窗口數(shù)據(jù)傳遞,需要的可以了解一下2022-12-12python+pygame實(shí)現(xiàn)坦克大戰(zhàn)
這篇文章主要為大家詳細(xì)介紹了python+pygame實(shí)現(xiàn)坦克大戰(zhàn),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09Python3 實(shí)現(xiàn)串口兩進(jìn)程同時(shí)讀寫
今天小編就為大家分享一篇Python3 實(shí)現(xiàn)串口兩進(jìn)程同時(shí)讀寫,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-06-06