Python處理excel根據(jù)全稱自動(dòng)填寫簡稱
在工作中處理excel遇到需要根據(jù)器件生產(chǎn)供應(yīng)商全稱填寫簡稱的一列,由于數(shù)據(jù)表格中器件數(shù)多達(dá)幾萬條,單純靠excel篩選功能手動(dòng)處理需要耗費(fèi)大量時(shí)間,這里使用Python中的pandas模塊,讀取excel進(jìn)行處理。
1、需求
根據(jù)存儲(chǔ)有供應(yīng)商全稱簡稱對(duì)應(yīng)的表格對(duì)應(yīng)關(guān)系.xlsx,自動(dòng)填寫帶有供應(yīng)商全稱的表格待處理文件.xlsx中簡稱的一列。
2.腳本思路
首先使用pandas讀取第一個(gè)表格對(duì)應(yīng)關(guān)系.xlsx,然后將其儲(chǔ)存在一個(gè)字典中,字典的鍵為供應(yīng)商的全稱,字典的值為供應(yīng)商的簡稱。
然后讀取第二個(gè)表格待處理文件.xlsx,根據(jù)列的標(biāo)題頭,找到供應(yīng)商全稱所處在的列,根據(jù)這一列每一個(gè)供應(yīng)商的全稱查詢字典中對(duì)應(yīng)鍵的值,將其寫入表格中對(duì)應(yīng)行的簡稱處。(這里暫時(shí)假設(shè)對(duì)應(yīng)關(guān)系和待處理文件中供應(yīng)商的全稱如果是同一家公司則公司全稱是一模一樣的,存在些許差別的處理的方法在下一篇文章中在記錄)。
3.代碼
# -*- coding: utf-8 -*- """ Created on Thu Mar 4 21:25:05 2021 @author: ruofei """ import pandas as pd #填寫待處理文件和對(duì)應(yīng)關(guān)系的excel文件路徑 #注意:腳本運(yùn)行時(shí)需保證被使用excel文件處于關(guān)閉狀態(tài) file1 = r'待處理文件.xlsx' file2 = r'對(duì)應(yīng)關(guān)系.xlsx' #填寫待處理文件中 全稱所在的列名和簡稱要放置的列名 qc1="供應(yīng)商" jc1="簡稱" #填寫對(duì)應(yīng)關(guān)系中 全稱所在的列數(shù)和簡稱所在的列數(shù) qc2="全稱" jc2="簡稱" #填寫讀取excel文件的sheet表名 sheet1="Sheet1" sheet2="Sheet1" #--------------------*-------------*--------------*--------------------- #--------------------*-------------*--------------*--------------------- data1 = pd.read_excel(file1, sheet_name = sheet1) data2 = pd.read_excel(file2, sheet_name = sheet2) #print("輸出表格所有") #print(data1) row1 = data1.shape[0]#行數(shù) col1=data1.shape[1]#列數(shù) row2 = data2.shape[0]#行數(shù) col2=data2.shape[1]# #print("表格文件有"+str(row1)+"行,"+str(col1)+"列") duiying=dict() #生成對(duì)應(yīng)關(guān)系的字典 for i in range(row2): quancheng=data2.loc[i,qc2] jiancheng=data2.loc[i,jc2] duiying[quancheng]=jiancheng #print(quancheng) #company1=data1.loc[0][0] #company2=data1.loc[1][0] #print("公司一為"+str(company1)+"\n"+"公司二為"+str(company2)) for i in range(row1): a=data1.loc[i,qc1] #[qc1-1] #print(str(a)) jiancheng=duiying.get(a) if a in duiying.keys(): #print(jiancheng) data1.loc[i,jc1]=jiancheng else: #此處修改沒有簡稱賦予值,若賦予全稱值則=a,若為空則=" " data1.loc[i,jc1]=a data1.to_excel('處理好的文件.xlsx',sheet_name='Sheet1')
4.實(shí)現(xiàn)功能
根據(jù)預(yù)先整理好的對(duì)應(yīng)關(guān)系表格自動(dòng)填寫了表格中簡稱空白的一列,如果表格中存在對(duì)應(yīng)關(guān)系中不存在的公司,則在相應(yīng)的簡稱位置填寫其全稱本身。如下圖中,由于表中的小米華為沒有給出其簡稱,因此原樣照填。
5.存在問題
在實(shí)際應(yīng)用中處理幾萬條數(shù)據(jù)時(shí),絕大部分正常,存在問題是,比如對(duì)應(yīng)關(guān)系中全稱為(中國)茅臺(tái)公司,而在要處理的文件中不存在括號(hào),或者括號(hào)中英文不同,或者括號(hào)中空格數(shù)不同,都會(huì)在后面讀取為不同的字符串,在查詢字典中顯示不存在。處理方式在下篇中解決。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
深入理解Python虛擬機(jī)中描述器的實(shí)現(xiàn)原理
這篇文章主要給大家介紹一個(gè)我們?cè)谑褂妙惖臅r(shí)候經(jīng)常使用但是卻很少在意的黑科技——描述器的實(shí)現(xiàn)原理,文中的示例代碼講解詳細(xì),需要的可以參考一下2023-05-05pytorch Dataset,DataLoader產(chǎn)生自定義的訓(xùn)練數(shù)據(jù)案例
這篇文章主要介紹了pytorch Dataset, DataLoader產(chǎn)生自定義的訓(xùn)練數(shù)據(jù)案例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03python實(shí)現(xiàn)mean-shift聚類算法
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)mean-shift聚類算法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-06-06Django模板繼承與模板的導(dǎo)入實(shí)例詳解
模板繼承主要是為了提高代碼重用,減輕開發(fā)人員的工作量,下面這篇文章主要給大家介紹了關(guān)于Django模板繼承與模板導(dǎo)入的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-03-03TensorFlow實(shí)現(xiàn)RNN循環(huán)神經(jīng)網(wǎng)絡(luò)
這篇文章主要介紹了TensorFlow實(shí)現(xiàn)RNN循環(huán)神經(jīng)網(wǎng)絡(luò),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-02-02Python學(xué)習(xí)筆記之常用函數(shù)及說明
俗話說“好記性不如爛筆頭”,老祖宗們幾千年總結(jié)出來的東西還是有些道理的,所以,常用的東西也要記下來,不記不知道,一記嚇一跳,乖乖,函數(shù)咋這么多捏2014-05-05python廣度優(yōu)先搜索得到兩點(diǎn)間最短路徑
這篇文章主要為大家詳細(xì)介紹了python廣度優(yōu)先搜索得到兩點(diǎn)間最短路徑,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-01-01