Python數(shù)據(jù)挖掘中常用的五種AutoEDA 工具總結(jié)
我們能否使用一些自動(dòng)化工具代替人來(lái)完成數(shù)據(jù)分析的過(guò)程呢,現(xiàn)有一些成熟的 AutoEDA 工具可以一定程度上完成上述過(guò)程。本文中,我將盤(pán)點(diǎn)常見(jiàn)的 AutoEDA 工具,歡迎收藏學(xué)習(xí),喜歡點(diǎn)贊支持,文末提供技術(shù)交流群,歡迎暢聊。
1、Pandas Profiling
https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html
Pandas Profiling
是款比較成熟的工具,可以直接傳入DataFrame即可完成分析過(guò)程,將結(jié)果展示為HTML格式,同時(shí)分析功能也比較強(qiáng)大。
- 功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、重復(fù)行分析
- 耗時(shí):較少
2、AutoViz
https://github.com/AutoViML/AutoViz
AutoViz
是款美觀的數(shù)據(jù)分析工具,在進(jìn)行可視化的同時(shí)將結(jié)果保存為圖片格式。
- 功能:相關(guān)性分析、數(shù)值變量箱線圖、數(shù)值變量分布圖
- 耗時(shí):較多
3、Dataprep
Dataprep
是款比較靈活也比較強(qiáng)大的工具,也是筆者最喜歡的。它可以指定列進(jìn)行分析,同時(shí)也可以在Notebook中進(jìn)行交互式分析。
- 功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、交互式分析。
- 耗時(shí):較多
4、SweetViz
https://github.com/fbdesignpro/sweetviz
SweetViz
是款強(qiáng)大的數(shù)據(jù)分析工具,可以很好的分析訓(xùn)練集和測(cè)試集,以及目標(biāo)標(biāo)簽與特征之間的關(guān)系。
- 功能:數(shù)據(jù)集對(duì)比分析、字段類型分析、變量分布分析、目標(biāo)變量分析
- 耗時(shí):中等
5、D-Tale
https://github.com/man-group/dtale
D-Tale
是款功能最為強(qiáng)大的數(shù)據(jù)分析工具,對(duì)單變量的分析過(guò)程支持比較好。
- 功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、交互式分析。
- 耗時(shí):中等
技術(shù)交流
歡迎轉(zhuǎn)載、收藏、有所收獲點(diǎn)贊支持一下!
到此這篇關(guān)于Python數(shù)據(jù)挖掘中常用的五種AutoEDA 工具總結(jié)的文章就介紹到這了,更多相關(guān)Python 數(shù)據(jù)挖掘內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python通過(guò)四大 AutoEDA 工具包快速產(chǎn)出完美數(shù)據(jù)報(bào)告
- 全面掌握Python?JSON庫(kù)函數(shù)與方法學(xué)會(huì)JSON數(shù)據(jù)處理
- Python梯度提升庫(kù)XGBoost解決機(jī)器學(xué)習(xí)問(wèn)題使用探究
- Python?ctypes庫(kù)底層交互秘籍實(shí)例探究
- 深入探究Python Numba庫(kù)編譯優(yōu)化利器
- Python?Pexpect庫(kù)自動(dòng)化交互式進(jìn)程控制的expect_list方法解析
- 常見(jiàn)Python AutoEDA工具庫(kù)及功能使用探究
相關(guān)文章
Queue 實(shí)現(xiàn)生產(chǎn)者消費(fèi)者模型(實(shí)例講解)
下面小編就為大家?guī)?lái)一篇Queue 實(shí)現(xiàn)生產(chǎn)者消費(fèi)者模型(實(shí)例講解)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-11-11Python實(shí)現(xiàn)新版正方系統(tǒng)滑動(dòng)驗(yàn)證碼識(shí)別
這篇文章主要介紹了基于Python實(shí)現(xiàn)新版正方系統(tǒng)滑動(dòng)驗(yàn)證碼識(shí)別算法和方案,文中示例代碼對(duì)我們的學(xué)習(xí)和工作有一定的幫助,感興趣的可以了解一下2021-12-12NumPy?與?Python?內(nèi)置列表計(jì)算標(biāo)準(zhǔn)差區(qū)別詳析
這篇文章主要介紹了NumPy與Python內(nèi)置列表計(jì)算標(biāo)準(zhǔn)差區(qū)別詳析,NumPy,是Numerical?Python的簡(jiǎn)稱,用于高性能科學(xué)計(jì)算和數(shù)據(jù)分析的基礎(chǔ)包,更多相關(guān)內(nèi)容需要的朋友可以參考一下2022-07-07Python編程二分法實(shí)現(xiàn)冒泡算法+快速排序代碼示例
這篇文章主要介紹了Python編程二分法實(shí)現(xiàn)冒泡算法+快速排序代碼示例,具有一定借鑒價(jià)值,需要的朋友可以參考下2018-01-01Python灰度變換中位圖切割分析實(shí)現(xiàn)
灰度變換是指根據(jù)某種目標(biāo)條件按一定變換關(guān)系逐點(diǎn)改變?cè)磮D像中每個(gè)像素灰度值的方法。目的是改善畫(huà)質(zhì),使圖像顯示效果更加清晰。圖像的灰度變換處理是圖像增強(qiáng)處理技術(shù)中的一種非?;A(chǔ)、直接的空間域圖像處理方法,也是圖像數(shù)字化軟件和圖像顯示軟件的一個(gè)重要組成部分2022-10-10