亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python分析學(xué)校四六級(jí)過關(guān)情況

 更新時(shí)間:2017年11月22日 16:46:19   作者:繁城落葉  
這篇文章主要為大家詳細(xì)介紹了利用Python分析學(xué)校四六級(jí)過關(guān)情況,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下

這段時(shí)間看了數(shù)據(jù)分析方面的內(nèi)容,對(duì)Python中的numpy和pandas有了最基礎(chǔ)的了解。我知道如果我不用這些技能做些什么的話,很快我就會(huì)忘記。想起之前群里發(fā)過一個(gè)學(xué)校的四六級(jí)成績表,正好可以用來熟悉一下pandas中的一些用法。

1.數(shù)據(jù)介紹。

成績表中包含的字段十分詳細(xì),里面有年級(jí)、性別、姓名、分?jǐn)?shù)等等的一系列內(nèi)容,我只想簡單的分析一下我們學(xué)校的四六級(jí)過關(guān)率而已,所以去除了一些不必要的字段。留下的有如下幾個(gè)字段:

第一列是自增的序號(hào),沒有什么實(shí)際意義。

第二列就是代表著該學(xué)生參加的是四級(jí)還是六級(jí)。

第三列是我們學(xué)校的院系名稱。

第四列是學(xué)校院系的各個(gè)專業(yè)。

第五列是年級(jí),13代表著2013年入學(xué)。

第六列是性別。

后面的三列分別是總分、聽力、閱讀、寫作等。

其中總分為0的都是缺考的。一共有接近9000條數(shù)據(jù)(沒有報(bào)名的不在其中)。

2.預(yù)期結(jié)果。

我想利用這些數(shù)據(jù)最終通過圖標(biāo)的形式展示出以下幾點(diǎn):

1.各個(gè)學(xué)院的四六級(jí)平均分。

2.各個(gè)學(xué)院的四六級(jí)過關(guān)人數(shù)。

3.各個(gè)學(xué)院的各個(gè)年級(jí)過關(guān)人數(shù)。

4.各個(gè)年級(jí)的過關(guān)人數(shù)。

5.男生女生分別過關(guān)人數(shù)。

最終結(jié)果:

各個(gè)學(xué)院的四六級(jí)過關(guān)人數(shù):

3.實(shí)現(xiàn)過程。

(1)導(dǎo)入依賴包。

程序分別使用了pandas進(jìn)行分組轉(zhuǎn)換,和matplotlib提供的繪圖功能。

import pandas as pd
import matplotlib.pylab as plt

(2)加載數(shù)據(jù)。

想要分析數(shù)據(jù)自然要得到數(shù)據(jù)了,我將整理的數(shù)據(jù)存放在sj.xls中,是一個(gè)Excel類型的數(shù)據(jù)。
這一步使用pandas的read_excel即可,生成一個(gè)DataFrame對(duì)象。

#加載全部數(shù)據(jù)
sj = pd.read_excel(r'F:\DataAnalysis\sj.xls')

加載完之后輸出一下看看內(nèi)容:

除了排版沒有對(duì)齊之外其他都一樣。

(3)統(tǒng)計(jì)各個(gè)學(xué)院平均分。

在這里就可以完成我們預(yù)期的第一個(gè)結(jié)果:

各個(gè)學(xué)院的四六級(jí)平均分:

想要各個(gè)學(xué)院的情況當(dāng)然是要根據(jù)學(xué)院來進(jìn)行分組了,同時(shí)也需要分出“CET4”和“CET6”兩組。使用groupby即可,這樣會(huì)生成一個(gè)SeriesGroupBy對(duì)象,然后再調(diào)用mean函數(shù)(默認(rèn)是軸0計(jì)算,也就是我們想要的結(jié)果)即可統(tǒng)計(jì)出平均分情況。

#按照各個(gè)學(xué)院進(jìn)行分組
xymean = sj['總分'].groupby([sj['院系名稱'],sj['語言級(jí)別']])

#計(jì)算各個(gè)學(xué)院的平均分?jǐn)?shù)
xymean = xymean.mean()

這個(gè)時(shí)候?qū)⑵漭敵龅脑挄?huì)得到如下結(jié)果:

由于院系名稱和語言級(jí)別是層次化索引的緣故,看起來并不是十分的友好,因此使用unstack將語言級(jí)別轉(zhuǎn)從行轉(zhuǎn)換為列。

xymean = xymean.unstack(level='語言級(jí)別')

再次輸出的話結(jié)果就比較清晰了

使用pandas的繪圖功能進(jìn)行繪圖:

#使用橫向柱狀圖顯示
xymean.plot(kind='barh')

#在PyCharm中需要使用,在Ipython環(huán)境中如果以--pylab形式打開就不需要
plt.show()

運(yùn)行一下看看結(jié)果:

可以看到這時(shí)候數(shù)據(jù)的結(jié)果都能夠顯示出來了,但是中文部分出現(xiàn)了問題,不過不要緊,科學(xué)上網(wǎng)一查就解決了:https://github.com/mwaskom/seaborn/issues/1009

添加一下代碼即可:

import matplotlib as mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['font.serif'] = ['SimHei']

再次運(yùn)行就OK了。

接下來要分析過關(guān)的情況了。

(4)篩選數(shù)據(jù)。

既然已經(jīng)有了所有的數(shù)據(jù)內(nèi)容了,下一步就是篩選出所有過關(guān)的人數(shù)了。

#過濾出過關(guān)人數(shù)
sjpass = sj[sj['總分'] >= 425]

這時(shí)候sjpass存放的就是所有的過關(guān)人數(shù)了。

在輸出結(jié)果的最下面就可以看到一共有1507行數(shù)據(jù),當(dāng)然也可以使用len()或者shape[0]查看共有多少行。

(5)各個(gè)學(xué)院的四六級(jí)過關(guān)人數(shù)。

已經(jīng)有了全部過關(guān)人的數(shù)據(jù)了,接下來根據(jù)預(yù)期結(jié)果進(jìn)行分組即可。同樣的根據(jù)“院系名稱”和“語言級(jí)別”對(duì)總分進(jìn)行分組,然后使用count函數(shù)進(jìn)行求和最后再用unstack進(jìn)行調(diào)整繪圖展示。

#按照各個(gè)學(xué)院進(jìn)行分組
xypass = sjpass['總分'].groupby([sjpass['院系名稱'],sjpass['語言級(jí)別']])


#計(jì)算各個(gè)學(xué)院的過關(guān)總?cè)藬?shù)
xypass = xypass.count()

#將語言級(jí)別作為columns
xypass = xypass.unstack(level='語言級(jí)別')

#進(jìn)行繪圖
xypass.plot(kind='barh')
plt.show()

繪圖結(jié)果:

(6)各個(gè)學(xué)院的各個(gè)年級(jí)過關(guān)人數(shù)。。

這次分組的時(shí)候加上年級(jí)即可,并且為了繪圖比較好看一點(diǎn),這次可以將“年紀(jì)”轉(zhuǎn)換為列,并且像12年這種的有些學(xué)員已經(jīng)沒有人參加了,所以需要將缺失值用0填充:

#按照各個(gè)學(xué)院和年級(jí)進(jìn)行分組
xypass = sjpass['總分'].groupby([sjpass['院系名稱'],sjpass['語言級(jí)別'],sjpass['年級(jí)']])

#計(jì)算各個(gè)學(xué)院的過關(guān)總?cè)藬?shù)
xypass = xypass.count()

#將語言級(jí)別作為columns,并且將缺失值用0進(jìn)行填充
xypass = xypass.unstack(level='年級(jí)').fillna(0)

xypass.plot(kind='barh')
plt.show()

繪圖結(jié)果:

(7)各個(gè)年級(jí)的過關(guān)人數(shù)。

使用groupby對(duì)年級(jí)進(jìn)行分組即可:

#-----------------各個(gè)年級(jí)過關(guān)人數(shù)------------------
njpass = sjpass['總分'].groupby([sjpass['年級(jí)'],sjpass['語言級(jí)別']]).count().unstack(level='語言級(jí)別')
njpass.plot(kind='barh')
plt.show()

繪圖結(jié)果:

(8)男生女生分別過關(guān)人數(shù)。

將性別和語言級(jí)別進(jìn)行分組:

#---------------男生女生過關(guān)情況----------------------
nvpass = sjpass['總分'].groupby([sjpass['性別'],sjpass['語言級(jí)別']]).count().unstack(level='語言級(jí)別')
nvpass.plot(kind='bar')
plt.show()

繪圖結(jié)果:

4.結(jié)果分析。

從繪圖的結(jié)果上來看的話,各個(gè)學(xué)院之間音樂學(xué)院的平均分比較低,藝術(shù)設(shè)計(jì)和外國語學(xué)院的平均分都比較高,但是過關(guān)人數(shù)卻沒有那么的多,尤其是藝術(shù)設(shè)計(jì)的人數(shù)比較少,主要也是因?yàn)樵搶W(xué)院的總?cè)藬?shù)比較少。

四級(jí)的過關(guān)人數(shù)明顯比六級(jí)的人數(shù)多的多,而且因?yàn)?5級(jí)是大二年級(jí),在我們學(xué)校大二才可以參加四六級(jí)考試,所以過關(guān)的人數(shù)里面15級(jí)占有比較大的比分。

而且不得不承認(rèn),女生的過關(guān)率要比男生高的不止一點(diǎn)。

源碼以及數(shù)據(jù):https://github.com/jiajia0/DataAnalysis

以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 詳解在Python中創(chuàng)建條形圖追趕動(dòng)畫

    詳解在Python中創(chuàng)建條形圖追趕動(dòng)畫

    動(dòng)畫是使可視化更具吸引力和用戶吸引力的好方法。它幫助我們以有意義的方式展示數(shù)據(jù)可視化。Matplotlib是一個(gè)非常流行的數(shù)據(jù)可視化庫,通常用于數(shù)據(jù)的圖形表示以及使用內(nèi)置函數(shù)的動(dòng)畫。本文將用Matplotlib繪制條形圖追趕動(dòng)畫,需要的可以參考一下
    2022-03-03
  • python實(shí)現(xiàn)身份證實(shí)名認(rèn)證的方法實(shí)例

    python實(shí)現(xiàn)身份證實(shí)名認(rèn)證的方法實(shí)例

    這篇文章主要給大家介紹了關(guān)于python實(shí)現(xiàn)身份證實(shí)名認(rèn)證的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-11-11
  • python爬蟲看看虎牙女主播中誰最“頂”步驟詳解

    python爬蟲看看虎牙女主播中誰最“頂”步驟詳解

    這篇文章主要介紹了python爬蟲看看虎牙女主播中誰最“頂”,本文分步驟通過圖文實(shí)例相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-12-12
  • python環(huán)境下安裝opencv庫的方法

    python環(huán)境下安裝opencv庫的方法

    這篇文章主要介紹了python環(huán)境下安裝opencv庫的方法 ,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-03-03
  • TensorFlow實(shí)現(xiàn)打印每一層的輸出

    TensorFlow實(shí)現(xiàn)打印每一層的輸出

    今天小編就為大家分享一篇TensorFlow實(shí)現(xiàn)打印每一層的輸出,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • 找Python安裝目錄,設(shè)置環(huán)境路徑以及在命令行運(yùn)行python腳本實(shí)例

    找Python安裝目錄,設(shè)置環(huán)境路徑以及在命令行運(yùn)行python腳本實(shí)例

    這篇文章主要介紹了找Python安裝目錄,設(shè)置環(huán)境路徑以及在命令行運(yùn)行python腳本實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • 使用Python實(shí)現(xiàn)更改Word文檔的頁面大小

    使用Python實(shí)現(xiàn)更改Word文檔的頁面大小

    頁面大小確定文檔中每個(gè)頁面的尺寸和布局,有時(shí)我們會(huì)需要自定義頁面大小以滿足特定要求,下面我們就來看看如何使用Python實(shí)現(xiàn)這一效果吧
    2024-03-03
  • 淺談機(jī)器學(xué)習(xí)需要的了解的十大算法

    淺談機(jī)器學(xué)習(xí)需要的了解的十大算法

    這篇文章主要介紹了淺談機(jī)器學(xué)習(xí)需要的了解的十大算法,具有一定借鑒價(jià)值,需要的朋友可以參考下。
    2017-12-12
  • 如何在Python中對(duì)文件進(jìn)行操作

    如何在Python中對(duì)文件進(jìn)行操作

    這篇文章主要介紹了如何在Python中對(duì)文件進(jìn)行操作,文章圍繞主題展開內(nèi)容,即使用Python中內(nèi)置的open()函數(shù)來打開文件,返回文件對(duì)象,并對(duì)文件進(jìn)行處理
    2022-08-08
  • Python中列表的常用操作詳解

    Python中列表的常用操作詳解

    這篇文章主要為大家詳細(xì)介紹了python字典的常用操作方法,主要內(nèi)容包含Python中列表(List)的詳解操作方法,包含創(chuàng)建、訪問、更新、刪除、其它操作等,需要的朋友可以參考下
    2021-09-09

最新評(píng)論