亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python?數(shù)據(jù)分析教程探索性數(shù)據(jù)分析

 更新時間:2022年08月17日 11:43:59   作者:海擁???????  
這篇文章主要介紹了Python?數(shù)據(jù)分析教程探索性數(shù)據(jù)分析,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下

什么是探索性數(shù)據(jù)分析(EDA)?

EDA 是數(shù)據(jù)分析下的一種現(xiàn)象,用于更好地理解數(shù)據(jù)方面,例如: 
– 數(shù)據(jù)的主要特征 
– 變量和它們之間的關(guān)系 
– 確定哪些變量對我們的問題很重要 
我們將研究各種探索性數(shù)據(jù)分析方法,

例如: 

  • 描述性統(tǒng)計,這是一種簡要概述我們正在處理的數(shù)據(jù)集的方法,包括樣本的一些度量和特征
  • 分組數(shù)據(jù) [使用group by 進行基本分組]
  • ANOVA,方差分析,這是一種計算方法,可將觀察集中的變化劃分為不同的分量。
  • 相關(guān)和相關(guān)方法

我們將使用的數(shù)據(jù)集是子投票數(shù)據(jù)集,您可以在 python 中將其導入為:

import pandas as pd
Df = pd.read_csv("https://vincentarelbundock.github.io / Rdatasets / csv / car / Child.csv")

描述性統(tǒng)計

描述性統(tǒng)計是了解數(shù)據(jù)特征和快速總結(jié)數(shù)據(jù)的有用方法。python 中的 Pandas 提供了一個有趣的方法describe() 。describe 函數(shù)對數(shù)據(jù)集應(yīng)用基本統(tǒng)計計算,如極值、數(shù)據(jù)點計數(shù)標準差等。任何缺失值或 NaN 值都會被自動跳過。describe() 函數(shù)很好地描繪了數(shù)據(jù)的分布情況。

DF.describe()

這是您在運行上述代碼時將獲得的輸出:

另一種有用的方法是 value_counts(),它可以獲取分類屬性值系列中每個類別的計數(shù)。例如,假設(shè)您正在處理一個客戶數(shù)據(jù)集,這些客戶在列名 age 下分為青年、中年和老年類別,并且您的數(shù)據(jù)框是“DF”。您可以運行此語句以了解有多少人屬于各個類別。在我們的數(shù)據(jù)集示例中可以使用教育列 

DF["education"].value_counts()

上述代碼的輸出將是:

另一個有用的工具是 boxplot,您可以通過 matplotlib 模塊使用它。箱線圖是數(shù)據(jù)分布的圖形表示,顯示極值、中位數(shù)和四分位數(shù)。我們可以使用箱線圖輕松找出異常值。現(xiàn)在再次考慮我們一直在處理的數(shù)據(jù)集,讓我們在屬性總體上繪制一個箱線圖 

import pandas as pd
import matplotlib.pyplot as plt
DF = pd.read_csv("https://raw.githubusercontent.com / fivethirtyeight / data / master / airline-safety / airline-safety.csv")
y = list(DF.population)
plt.boxplot(y)
plt.show()

發(fā)現(xiàn)異常值后,輸出圖將如下所示:

分組數(shù)據(jù)

Group by 是 pandas 中可用的一個有趣的度量,它可以幫助我們找出不同分類屬性對其他數(shù)據(jù)變量的影響。讓我們看一個在同一數(shù)據(jù)集上的示例,我們想找出人們的年齡和教育對投票數(shù)據(jù)集的影響。

DF.groupby(['education', 'vote']).mean()

輸出會有點像這樣:

如果按輸出表進行分組難以理解,則進一步的分析師使用數(shù)據(jù)透視表和熱圖對其進行可視化。 

方差分析

ANOVA 代表方差分析。執(zhí)行它是為了找出不同類別數(shù)據(jù)組之間的關(guān)系。 
在 ANOVA 下,我們有兩個測量結(jié)果: 
– F-testscore:顯示組均值相對于變化的變化 
– p 值:顯示結(jié)果的重要性 
這可以使用 python 模塊 scipy 方法名稱f_oneway() 

這些樣本是每組的樣本測量值。 
作為結(jié)論,如果 ANOVA 檢驗給我們一個大的 F 檢驗值和一個小的 p 值,我們可以說其他變量和分類變量之間存在很強的相關(guān)性。

相關(guān)性和相關(guān)性計算

相關(guān)性是上下文中兩個變量之間的簡單關(guān)系,使得一個變量影響另一個變量。相關(guān)性不同于引起的行為。計算變量之間相關(guān)性的一種方法是找到 Pearson 相關(guān)性。在這里,我們找到兩個參數(shù),即皮爾遜系數(shù)和 p 值。當 Pearson 相關(guān)系數(shù)接近 1 或 -1 且 p 值小于 0.0001 時,我們可以說兩個變量之間存在很強的相關(guān)性。 
Scipy 模塊還提供了一種執(zhí)行 pearson 相關(guān)性分析的方法,

這里的示例是您要比較的屬性。 

到此這篇關(guān)于Python 數(shù)據(jù)分析教程探索性數(shù)據(jù)分析的文章就介紹到這了,更多相關(guān)Python 索性數(shù)據(jù)分析內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 淺談python之自動化運維(Paramiko)

    淺談python之自動化運維(Paramiko)

    這篇文章主要介紹了淺談python之自動化運維(Paramiko),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-01-01
  • Python能做什么

    Python能做什么

    在本篇文章里小編給大家整理的是關(guān)于Python作用領(lǐng)域等相關(guān)知識點,需要的朋友們可以參考下。
    2020-06-06
  • Python在Windows和在Linux下調(diào)用動態(tài)鏈接庫的教程

    Python在Windows和在Linux下調(diào)用動態(tài)鏈接庫的教程

    這篇文章主要介紹了Python在Windows和在Linux下調(diào)用動態(tài)鏈接庫的教程,在進行Python的CS端編程時經(jīng)常需要用到,需要的朋友可以參考下
    2015-08-08
  • Python實現(xiàn)上課點名器系統(tǒng)

    Python實現(xiàn)上課點名器系統(tǒng)

    今天給大家分享一個讀者粉絲投稿的,關(guān)于上課點名的實戰(zhàn)案例,對Python上課點名器實現(xiàn)過程感興趣的朋友,一起來看看是如何實現(xiàn)的吧
    2021-10-10
  • Python?中?key?參數(shù)的含義及用法小結(jié)

    Python?中?key?參數(shù)的含義及用法小結(jié)

    我們在使用?sorted()?或?map()?函數(shù)的時候,都會看到里面有一個?key?參數(shù),其實這個?key?參數(shù)也存在于其他內(nèi)置函數(shù)中(例如?min()、max()?等),那么我們今天就來了解一下?key?參數(shù)的含義以及用途吧,需要的朋友可以參考下
    2023-12-12
  • selenium自動化測試簡單準備

    selenium自動化測試簡單準備

    本文主要介紹了selenium自動化測試簡單準備,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-01-01
  • 使用Python來開發(fā)Markdown腳本擴展的實例分享

    使用Python來開發(fā)Markdown腳本擴展的實例分享

    這篇文章主要介紹了使用Python來開發(fā)Markdown腳本擴展的實例分享,文中的示例是用來簡單地轉(zhuǎn)換文檔結(jié)構(gòu),主要為了體現(xiàn)一個思路,需要的朋友可以參考下
    2016-03-03
  • python 實現(xiàn)人和電腦猜拳的示例代碼

    python 實現(xiàn)人和電腦猜拳的示例代碼

    這篇文章主要介紹了python 實現(xiàn)人和電腦猜拳的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-03-03
  • python中如何讓輸出不換行

    python中如何讓輸出不換行

    這篇文章主要介紹了python中如何讓輸出不換行問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-05-05
  • Python實現(xiàn)人機中國象棋游戲

    Python實現(xiàn)人機中國象棋游戲

    中國象棋是一種古老的棋類游戲,大約有兩千年的歷史。本文將介紹如何通過Python中的Pygame模塊實現(xiàn)人機中國象棋游戲,感興趣的可以學習一下
    2022-01-01

最新評論