亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

?分享4款Python 自動數(shù)據(jù)分析神器

 更新時間:2022年03月03日 09:20:29   作者:Python學習與數(shù)據(jù)挖掘  
這篇文章主要給大家分享的是4款Python 自動數(shù)據(jù)分析神器,我給大家分享 4 款常用的EDA工具,它們可以自動產(chǎn)出統(tǒng)計數(shù)據(jù)和圖表,為我們節(jié)省大量時間,需要的朋友可以參考一下

前言:

我們做數(shù)據(jù)分析,在第一次拿到數(shù)據(jù)集的時候,一般會用統(tǒng)計學或可視化方法來了解原始數(shù)據(jù)。比如了解列數(shù)、行數(shù)、取值分布、缺失值、列之間的相關關系等等,這個過程我們叫做 EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)。

pandas一行行寫代碼,那太痛苦了!目前已經(jīng)有很多EDA工具可以自動產(chǎn)出基礎的統(tǒng)計數(shù)據(jù)和圖表,能為我們節(jié)省大量時間。

在本文,我給大家分享 4 款常用的EDA工具,它們可以自動產(chǎn)出統(tǒng)計數(shù)據(jù)和圖表,為我們節(jié)省大量時間。

正式介紹這些工具之前,先來加載數(shù)據(jù)集

import numpy as np
import pandas as pd
iris = pd.read_csv('iris.csv')
iris

iris是下面用到的數(shù)據(jù)集,是一個150行 * 4列的 DataFrame。

1. PandasGUI

PandasGUI提供數(shù)據(jù)預覽、篩選、統(tǒng)計、多種圖表展示以及數(shù)據(jù)轉(zhuǎn)換。

# 安裝
# pip install pandasgui
from pandasgui import show

show(iris)

PandasGUI操作界面

PandasGUI更側(cè)重數(shù)據(jù)展示,提供了10多種圖表,通過可視的方式配置。

但數(shù)據(jù)統(tǒng)計做的比較簡單,沒有提供缺失值、相關系數(shù)等指標,數(shù)據(jù)轉(zhuǎn)換部分也只開放了一小部分接口。

2. Pandas Profiling

Pandas Profiling 提供了整體數(shù)據(jù)概況、每列的詳情、列之間的關圖、列之間的相關系數(shù)。

# 安裝:
# pip install -U pandas-profiling
# jupyter nbextension enable --py widgetsnbextension

from pandas_profiling import ProfileReport

profile = ProfileReport(iris, title='iris Pandas Profiling Report', explorative=True)
profile

Pandas Profiling操作界面

每列的詳情包括:缺失值統(tǒng)計、去重計數(shù)、最值、平均值等統(tǒng)計指標和取值分布的柱狀圖。

列之間的相關系數(shù)支持Spearman、Pearson、Kendall 和 Phik 4 種相關系數(shù)算法。

PandasGUI 相反,Pandas Profiling沒有豐富的圖表,但提供了非常多的統(tǒng)計指標以及相關系數(shù)。

3. Sweetviz

SweetvizPandas Profiling類似,提供了每列詳細的統(tǒng)計指標、取值分布、缺失值統(tǒng)計以及列之間的相關系數(shù)。

# 安裝
# pip install sweetviz

import sweetviz as sv

sv_report = sv.analyze(iris)
sv_report.show_html()

Sweetviz操作界面

Sweetviz還有有一個非常好的特性是支持不同數(shù)據(jù)集的對比,如:訓練數(shù)據(jù)集和測試數(shù)據(jù)集的對比。

Sweetviz數(shù)據(jù)集對比

藍色和橙色代表不同的數(shù)據(jù)集,通過對比可以清晰發(fā)現(xiàn)數(shù)據(jù)集之前的差異。

4. dtale

最后重磅介紹dtale,它不僅提供豐富圖表展示數(shù)據(jù),還提供了很多交互式的接口,對數(shù)據(jù)進行操作、轉(zhuǎn)換。

dtale操作界面

dtale的功能主要分為三部分:數(shù)據(jù)操作、數(shù)據(jù)可視化、高亮顯示。

4.1 數(shù)據(jù)操作(Actions)

dtalepandas的函數(shù)包裝成可視化接口,可以讓我們通過圖形界面方式來操作數(shù)據(jù)。

# pip install dtale

import dtale

d = dtale.show(iris)
d.open_browser()

Actions

右半部分圖是左邊圖的中文翻譯,用的是 Chrome 自動翻譯,有些不是很準確。

舉一個數(shù)據(jù)操作的例子:

Summarize Data

上圖是Actions菜單中Summarize Data的功能,它提供了對數(shù)據(jù)集匯總操作的接口。

上圖我們選擇按照species列分組,計算sepal_width列的平均值,同時可以看到左下角dtale已經(jīng)自動為該操作生成了pandas代碼。

4.2 數(shù)據(jù)可視化(Visualize)

提供比較豐富的圖表,對每列數(shù)據(jù)概況、重復行、缺失值、相關系數(shù)進行統(tǒng)計和展示。

Visualize

舉一個數(shù)據(jù)可視化的例子:

Describe

上圖是Visualize菜單中Describe的功能,它可以統(tǒng)計每列的最值、均值、標準差等指標,并提供圖表展示。

右側(cè)的Code Export可以查看生成這些數(shù)據(jù)的代碼。

4.3 高亮顯示(Highlight)

對缺失值、異常值做高亮顯示,方便我們快速定位到異常的數(shù)據(jù)。

Highlight

上圖顯示了將sepal_width字段的異常值。

dtale非常強大,功能也非常多,大家可以多多探索、挖掘。

最后,簡單總結一下。如果探索的數(shù)據(jù)集側(cè)重數(shù)據(jù)展示,可以選PandasGUI;如果只是簡單了解基本統(tǒng)計指標,可以選擇Pandas Profiling和Sweetviz;如果需要做深度的數(shù)據(jù)探索,那就選擇dtale。

到此這篇關于 分享4款Python 自動數(shù)據(jù)分析神器的文章就介紹到這了,更多相關Python 自動數(shù)據(jù)分析神器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python深度學習之使用Pytorch搭建ShuffleNetv2

    Python深度學習之使用Pytorch搭建ShuffleNetv2

    這篇文章主要介紹了Python深度學習之使用Pytorch搭建ShuffleNetv2,文中有非常詳細的圖文示例,對正在學習python的小伙伴們有非常好的幫助,需要的朋友可以參考下
    2021-05-05
  • python逆向微信指數(shù)爬取實現(xiàn)步驟

    python逆向微信指數(shù)爬取實現(xiàn)步驟

    這篇文章主要為大家介紹了python逆向微信指數(shù)爬取的實現(xiàn)步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步早日升職加薪
    2022-02-02
  • 解決py2exe打包后,總是多顯示一個DOS黑色窗口的問題

    解決py2exe打包后,總是多顯示一個DOS黑色窗口的問題

    今天小編就為大家分享一篇解決py2exe打包后,總是多顯示一個DOS黑色窗口的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • Python程序打包exe報錯的幾種解決方法

    Python程序打包exe報錯的幾種解決方法

    本文主要介紹了Python程序打包exe報錯的幾種解決方法,文中通過幾種解決方法的介紹非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2023-08-08
  • python無法引用另一個文件夾的py文件問題及解決

    python無法引用另一個文件夾的py文件問題及解決

    這篇文章主要介紹了python無法引用另一個文件夾的py文件問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • 說一說Python logging

    說一說Python logging

    這篇文章主要和大家聊一聊Python logging,Python logging是什么,Python logging的作用是什么,感興趣的小伙伴們可以參考一下
    2016-04-04
  • Python使用CRC32實現(xiàn)校驗文件

    Python使用CRC32實現(xiàn)校驗文件

    CRC文件校驗是一種用于驗證文件完整性的方法,通過計算文件的CRC值并與預先計算的CRC校驗值進行比較,來判斷文件是否發(fā)生變化,本文我們就來介紹一下Python如何利用CRC32實現(xiàn)校驗文件吧
    2023-10-10
  • Python定時發(fā)送天氣預報郵件代碼實例

    Python定時發(fā)送天氣預報郵件代碼實例

    這篇文章主要介紹了Python定時發(fā)送天氣預報郵件代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-09-09
  • Pandas中字符串和時間轉(zhuǎn)換與格式化的實現(xiàn)

    Pandas中字符串和時間轉(zhuǎn)換與格式化的實現(xiàn)

    本文主要介紹了Pandas中字符串和時間轉(zhuǎn)換與格式化的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-01-01
  • 將Emacs打造成強大的Python代碼編輯工具

    將Emacs打造成強大的Python代碼編輯工具

    這篇文章主要介紹了將Emacs打造成強大的Python代碼編輯工具的方法,人們常說Vim是編輯器之神而Emacs是神的編輯器:)需要的朋友可以參考下
    2015-11-11

最新評論