Python中實(shí)現(xiàn)一行拆多行和多行并一行的示例代碼
粉絲提問
今天粉絲提了下面這樣一個(gè)問題,其中一個(gè)是"一行拆多行",另外一個(gè)是"多行并一行",貌似群友用power query已經(jīng)解決了。但是基于Python怎么做呢?接著往下看。
一行拆多行
上面這個(gè)問題我會提供兩個(gè)思路,供大家選擇,當(dāng)然肯定是越簡單得越好。每一種方法中都有一些好用的技巧,希望大家能夠好好學(xué)習(xí)。
1)方法一
下方代碼中有很多重要的知識點(diǎn),需要我們下去好好學(xué)習(xí)一下,我這里只提供解體思路,關(guān)于每個(gè)知識點(diǎn)怎么用,希望大家下去自行研究學(xué)習(xí)。
- Pandas.melt()函數(shù)的用法;
- Series.str.split("/",expand=True)中,expand=True參數(shù)的用法;
- Series.sort_values()對文本進(jìn)行排序;
- Python中enumerate()函數(shù)的用法;
import pandas as pd # 讀取數(shù)據(jù) df = pd.read_excel("test1.xlsx",sheet_name="Sheet1") # 將一列炸裂成多列 df[["類型1","類型2","類型3"]] = df["電影類型"].str.split("/",expand=True) # 選取想要的列 df_final = df[["電影名","類型1","類型2","類型3"]] # 將行專列 df_final = df_final.melt(id_vars=["電影名"],value_name="類型") # 對“電影名”字段進(jìn)行排序 df_final = df_final[["電影名","類型"]] df_final.sort_values(by="電影名",inplace=True) # 刪除“類型==None”的行 for index,value in enumerate(df_final["類型"]): if value == None: df_final.drop(df_final.index[index],inplace=True) df_final
結(jié)果如下:
2)方法二
上述方法確實(shí)感覺復(fù)雜了,但是沒辦法,我之前的Pandas版本只有0.23.4,因此無法用explode()方法,進(jìn)行炸裂操作。在pandas0.25版本的時(shí)候, DataFrame中才新增了一個(gè)explode方法, 專門用來將一行變多行。
Pandas.explode()函數(shù)的用法;
import pandas as pd # 讀取數(shù)據(jù) df = pd.read_excel("test1.xlsx",sheet_name="Sheet1") # 將一行拆分成列表形式,注意:這里不需要使用expand=True參數(shù) df["type"] = df["電影類型"].str.split("/") # 直接炸裂指定列 df.explode("type")
結(jié)果如下:
多行并一行
這里沒有使用什么特別的知識,好好理解Pandas中分組聚合應(yīng)用某個(gè)函數(shù),即可輕松解決這個(gè)問題。
import pandas as pd # 讀取數(shù)據(jù) df = pd.read_excel("test1.xlsx",sheet_name="Sheet2") # 分組聚合,應(yīng)用某個(gè)函數(shù) def func(df): return ','.join(df.values) df = df.groupby(by='電影名').agg(func).reset_index() df
結(jié)果如下:
到此這篇關(guān)于Python中實(shí)現(xiàn)一行拆多行和多行并一行的示例代碼的文章就介紹到這了,更多相關(guān)Python 一行拆多行和多行并一行內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
selenium獲取當(dāng)前頁面的url、源碼、title的方法
這篇文章主要介紹了selenium獲取當(dāng)前頁面的url、源碼、title的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06Python升級導(dǎo)致yum、pip報(bào)錯的解決方法
這篇文章主要給大家介紹了因?yàn)镻ython升級導(dǎo)致yum、pip報(bào)錯的解決方法,文中通過示例代碼將解決的方法介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)下吧。2017-09-09Python數(shù)據(jù)分析的八種處理缺失值方法詳解
缺失值可能是數(shù)據(jù)科學(xué)中最不受歡迎的值,然而,它們總是在身邊。忽略缺失值也是不合理的,因此我們需要找到有效且適當(dāng)?shù)靥幚硭鼈兊姆椒?/div> 2021-11-11pygame學(xué)習(xí)筆記(3):運(yùn)動速率、時(shí)間、事件、文字
這篇文章主要介紹了pygame學(xué)習(xí)筆記(3):運(yùn)動速率、時(shí)間、事件、文字,本文講解了運(yùn)動速率、事件、字體及字符顯示等內(nèi)容,需要的朋友可以參考下2015-04-04最新評論