使用pandas對兩個(gè)dataframe進(jìn)行join的實(shí)例
需求:
兩個(gè)文件,一個(gè)文件為統(tǒng)計(jì)報(bào)表,里面含有手機(jī)號,另一個(gè)文件為手機(jī)號段歸屬地,含有手機(jī)號碼前七位對應(yīng)的地區(qū)。需要對統(tǒng)計(jì)報(bào)表進(jìn)行處理,將手機(jī)號所在的歸屬地加入到統(tǒng)計(jì)報(bào)表中,使用pandas提供的join功能來實(shí)現(xiàn),代碼如下:
#coding=utf-8 from pandas import Series,DataFrame import pandas as pd #reader1 = pd.read_csv('Dm_Mobile.txt',iterator=True,encoding="gb2312") #df1 = reader1.get_chunk(10) #reader2 = pd.read_csv('201604.csv',iterator=True,encoding="gb2312") #df2 = reader.get_chunk(10) #讀取兩個(gè)csv文件,生成dataframe df1 = pd.read_csv('Dm_Mobile.csv',encoding="gb2312") df2 = pd.read_csv('201604.csv',encoding="gb2312") #截取手機(jī)號前七位,作為新列添加到dataframe df2['p7s'] = Series([str(x)[:7] for x in Series(df2[u'手機(jī)號'])]) df2['p7i'] = df2['p7s'].astype("int64") #在兩個(gè)dataframe的手機(jī)前七位列上創(chuàng)建索引 index_df1 = df1.set_index('MobileNumber') index_df2 = df2.set_index(['p7i']) #以手機(jī)號前七位列為join列,對兩個(gè)dataframe進(jìn)行join result = pd.concat([index_df1, index_df2], axis=1, join='inner') #選取需要顯示的列,重新生成result result = result.reindex(columns=[u'積分商城訂單號', u'手機(jī)號',u'產(chǎn)品編碼',u'商品名稱',u'商品價(jià)格',u'數(shù)量',u'虛擬碼',u'消費(fèi)時(shí)間',u'時(shí)間',u'兌換渠道商',u'MobileArea']) #寫入到excel文件中 writer = pd.ExcelWriter('pandas_simple.xlsx') result.to_excel(writer, sheet_name=u'設(shè)計(jì)院',index=False) writer.save()
以上這篇使用pandas對兩個(gè)dataframe進(jìn)行join的實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python 計(jì)算數(shù)據(jù)偏差和峰度的方法
今天小編就為大家分享一篇python 計(jì)算數(shù)據(jù)偏差和峰度的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06利用Python實(shí)現(xiàn)斐波那契數(shù)列的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于如何利用Python實(shí)現(xiàn)斐波那契數(shù)列的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07Python多維/嵌套字典數(shù)據(jù)無限遍歷的實(shí)現(xiàn)
下面小編就為大家?guī)硪黄狿ython多維/嵌套字典數(shù)據(jù)無限遍歷的實(shí)現(xiàn)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2016-11-11基于python實(shí)現(xiàn)把json數(shù)據(jù)轉(zhuǎn)換成Excel表格
這篇文章主要介紹了基于python實(shí)現(xiàn)把json數(shù)據(jù)轉(zhuǎn)換成Excel表格,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05python自動化測試之DDT數(shù)據(jù)驅(qū)動的實(shí)現(xiàn)代碼
這篇文章主要介紹了python自動化測試之DDT數(shù)據(jù)驅(qū)動的實(shí)現(xiàn)代碼,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07