亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python+pandas數(shù)據(jù)分析實踐總結(jié)

 更新時間:2023年07月14日 08:45:16   作者:Logos_515  
這篇文章主要介紹了Python+pandas數(shù)據(jù)分析實踐總結(jié)的相關(guān)資料,需要的朋友可以參考下

引言:

  在近日的python數(shù)據(jù)分析實戰(zhàn)課中,我學(xué)習(xí)到使用python進行數(shù)據(jù)分析的流程、方法,對常使用的函數(shù)有一些認識和了解,對 numpy, pandas 包有了一定的理解但不深。這篇博客將是我自己用于總結(jié)歸納的圣地,我將對整個項目的 key point 進行歸納總結(jié),提取其中精華之所在,汲取之加以奮發(fā)向前。

一、分析數(shù)據(jù)文件:

  在拿到數(shù)據(jù)的第一刻,莫急,先打開數(shù)據(jù)文件看一看,明白文件里的數(shù)據(jù)能夠說明什么。于是乎我們得以提出分析的目標(biāo),并開始思索如何能夠?qū)崿F(xiàn)我們的目的。例如,我們手里有一份某電商平臺一年的營銷數(shù)據(jù),這份數(shù)據(jù)中包含了達成交易訂單的用戶ID、本次訂單對應(yīng)的商品數(shù)量、總價、時間,思考:我們可以利用這些數(shù)據(jù)得到哪些結(jié)論?——從時間維度:分析不同月份的營銷額;從客戶維度:分析回購率、復(fù)購率、新老用戶比例。根據(jù)得出的結(jié)論,我們得以制定相應(yīng)的策略來提高商家的盈利。

二、數(shù)據(jù)預(yù)處理:

提一嘴,在文件最開始導(dǎo)入包的時候輸入 plt.rcParams['font.sans-serif'] = 'SimHei' 以讓中文能夠正常顯示(IPython中如此)

首先讀取文件,利用 pandas 根據(jù)不同文件類型選擇不同的讀取函數(shù):

  • csv: pd.read_csv('name.csv', encoding='utf-8/GBK')
  • text: pd.read_table('name.txt', names=columns, sep='\s+') # names指定每一列數(shù)據(jù)的含義,sep是劃分?jǐn)?shù)據(jù)時的參考,\s+表示跳過任意多的空格
  • excel: pd.read_excel('name.xlsx')

接著進行數(shù)據(jù)的預(yù)處理:

  • 對于出現(xiàn)NAN的行或列且需要刪除的:data.dropna(axis=0, how='any', inplace=True) # 刪除帶有NAN的一整行數(shù)據(jù),并修改原值
  • 對于重復(fù)出現(xiàn)的行或列:data.drop_duplicates(axis=0, inplace=True) # 刪除重復(fù)的行,并修改原值
  • 對于無用的行或列:data.drop(columns='order_id', axis=1, inplace=True) # 刪除 order_id 這一列
  • 對于需要更新索引的數(shù)據(jù):data.reset_index(drop=True, inplace=True) 把原來的索引index列刪除,并更新index

對于單位不統(tǒng)一的數(shù)據(jù):如下圖

看到銷售金額一列的單位有元也有萬元,并且含有逗號,為了方便處理,我們將其格式化。

def data_deal(number):
    if number.find('萬元')!= -1:#找到帶有萬元的,取出數(shù)字,去掉逗號,轉(zhuǎn)成float,*10000
        number_new = float(number[:number.find('萬元')].replace(',',''))*10000
    else: # 找到帶有元的并處理
        number_new = float(number[:number.find('元')].replace(',',''))
    return number_new
data['銷售金額'] = data['銷售金額'].map(data_deal)

這里我們使用到了 Series.map() 函數(shù),該函數(shù)的作用與 apply 和 applymap 類似,接收一個函數(shù)或含有映射關(guān)系的字典型對象,區(qū)別如下:

  • apply:作用于dataframe的整行或整列
  • applymap:作用于dataframe的每一個元素
  • map:作用于series中的每一個元素,在df結(jié)構(gòu)中無法使用map函數(shù)

詳情:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.map.html?highlight=map

到此這篇關(guān)于Python+pandas數(shù)據(jù)分析實踐總結(jié)的文章就介紹到這了,更多相關(guān)python數(shù)據(jù)分析內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python爬蟲必備技巧詳細總結(jié)

    Python爬蟲必備技巧詳細總結(jié)

    本篇文章介紹了我在爬蟲過程中總結(jié)的幾個必備技巧,都是經(jīng)過實驗的,通讀本篇對大家的學(xué)習(xí)或工作具有一定的價值,需要的朋友可以參考下
    2021-10-10
  • 使用Python腳本將絕對url替換為相對url的教程

    使用Python腳本將絕對url替換為相對url的教程

    這篇文章主要介紹了使用Python腳本將絕對url替換為相對url的教程,腳本代碼非常簡單,需要的朋友可以參考下
    2015-04-04
  • Python獲取DLL和EXE文件版本號的方法

    Python獲取DLL和EXE文件版本號的方法

    這篇文章主要介紹了Python獲取DLL和EXE文件版本號的方法,實例分析了Python獲取系統(tǒng)文件信息的技巧,需要的朋友可以參考下
    2015-03-03
  • Python實現(xiàn)批量將word轉(zhuǎn)換成pdf

    Python實現(xiàn)批量將word轉(zhuǎn)換成pdf

    這篇文章主要為大家詳細介紹了如何利用Python實現(xiàn)批量將word文檔轉(zhuǎn)換成pdf文件,文中的示例代碼簡潔易懂,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-08-08
  • python的描述器descriptor詳解

    python的描述器descriptor詳解

    這篇文章主要介紹了python的描述器descriptor詳解,描述器可以用于控制屬性的讀取、寫入和刪除等操作,同時還可以用于實現(xiàn)計算屬性、類屬性、屬性別名等高級功能,需要的朋友可以參考下
    2023-07-07
  • Python利用itchat庫向好友或者公眾號發(fā)消息的實例

    Python利用itchat庫向好友或者公眾號發(fā)消息的實例

    今天小編就為大家分享一篇Python利用itchat庫向好友或者公眾號發(fā)消息的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-02-02
  • Django實現(xiàn)微信小程序的登錄驗證功能并維護登錄態(tài)

    Django實現(xiàn)微信小程序的登錄驗證功能并維護登錄態(tài)

    這篇文章主要介紹了Django實現(xiàn)小程序的登錄驗證功能并維護登錄態(tài),本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-07-07
  • python3轉(zhuǎn)換code128條形碼的方法

    python3轉(zhuǎn)換code128條形碼的方法

    這篇文章主要介紹了python3轉(zhuǎn)換code128條形碼的方法,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-04-04
  • python 殺死自身進程的實現(xiàn)方法

    python 殺死自身進程的實現(xiàn)方法

    今天小編就為大家分享一篇python 殺死自身進程的實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • 詳解Flask框架中Flask-Login模塊的使用

    詳解Flask框架中Flask-Login模塊的使用

    Flask-Login 是一個 Flask 模塊,可以為 Flask 應(yīng)用程序提供用戶登錄功能。這篇文章將通過一些示例為大家介紹一下Flask-Login模塊的使用,需要的可以參考一下
    2023-01-01

最新評論