快捷導航

Python處理excel根據(jù)全稱自動填寫簡稱

更新時間：2021年03月11日 07:28:17 作者：愛吃腸粉的小若

這篇文章主要為大家詳細介紹了Python處理excel根據(jù)全稱自動填寫簡稱，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下

在工作中處理excel遇到需要根據(jù)器件生產(chǎn)供應(yīng)商全稱填寫簡稱的一列，由于數(shù)據(jù)表格中器件數(shù)多達幾萬條，單純靠excel篩選功能手動處理需要耗費大量時間，這里使用Python中的pandas模塊，讀取excel進行處理。

1、需求

根據(jù)存儲有供應(yīng)商全稱簡稱對應(yīng)的表格對應(yīng)關(guān)系.xlsx，自動填寫帶有供應(yīng)商全稱的表格待處理文件.xlsx中簡稱的一列。

2.腳本思路

首先使用pandas讀取第一個表格對應(yīng)關(guān)系.xlsx，然后將其儲存在一個字典中，字典的鍵為供應(yīng)商的全稱，字典的值為供應(yīng)商的簡稱。

然后讀取第二個表格待處理文件.xlsx，根據(jù)列的標題頭，找到供應(yīng)商全稱所處在的列，根據(jù)這一列每一個供應(yīng)商的全稱查詢字典中對應(yīng)鍵的值，將其寫入表格中對應(yīng)行的簡稱處。(這里暫時假設(shè)對應(yīng)關(guān)系和待處理文件中供應(yīng)商的全稱如果是同一家公司則公司全稱是一模一樣的，存在些許差別的處理的方法在下一篇文章中在記錄)。

3.代碼

# -*- coding: utf-8 -*-
"""
Created on Thu Mar 4 21:25:05 2021
@author: ruofei
"""
 
import pandas as pd
 
 
#填寫待處理文件和對應(yīng)關(guān)系的excel文件路徑
#注意：腳本運行時需保證被使用excel文件處于關(guān)閉狀態(tài)
file1 = r'待處理文件.xlsx'
file2 = r'對應(yīng)關(guān)系.xlsx'
 
 
#填寫待處理文件中 全稱所在的列名和簡稱要放置的列名
qc1="供應(yīng)商"
jc1="簡稱"
 
#填寫對應(yīng)關(guān)系中  全稱所在的列數(shù)和簡稱所在的列數(shù)
qc2="全稱"
jc2="簡稱"
 
 
#填寫讀取excel文件的sheet表名
sheet1="Sheet1"
sheet2="Sheet1"
 
#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)
 
#print("輸出表格所有")
#print(data1)
 
row1 = data1.shape[0]#行數(shù)
col1=data1.shape[1]#列數(shù)
 
row2 = data2.shape[0]#行數(shù)
col2=data2.shape[1]#
 
#print("表格文件有"+str(row1)+"行，"+str(col1)+"列")
 
duiying=dict()
 
#生成對應(yīng)關(guān)系的字典
for i in range(row2):
  
  quancheng=data2.loc[i,qc2]
  jiancheng=data2.loc[i,jc2]
  
  duiying[quancheng]=jiancheng
  
  
  #print(quancheng)
 
#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一為"+str(company1)+"\n"+"公司二為"+str(company2))
 
for i in range(row1):
  
  a=data1.loc[i,qc1]
  #[qc1-1]
  #print(str(a))
  
  jiancheng=duiying.get(a)
  if a in duiying.keys():
   
    #print(jiancheng)
    data1.loc[i,jc1]=jiancheng 
  else:
    
    
    #此處修改沒有簡稱賦予值，若賦予全稱值則=a，若為空則="  "
    data1.loc[i,jc1]=a
 
data1.to_excel('處理好的文件.xlsx',sheet_name='Sheet1')

4.實現(xiàn)功能

根據(jù)預(yù)先整理好的對應(yīng)關(guān)系表格自動填寫了表格中簡稱空白的一列，如果表格中存在對應(yīng)關(guān)系中不存在的公司，則在相應(yīng)的簡稱位置填寫其全稱本身。如下圖中，由于表中的小米華為沒有給出其簡稱，因此原樣照填。

5.存在問題

在實際應(yīng)用中處理幾萬條數(shù)據(jù)時，絕大部分正常，存在問題是，比如對應(yīng)關(guān)系中全稱為（中國）茅臺公司，而在要處理的文件中不存在括號，或者括號中英文不同，或者括號中空格數(shù)不同，都會在后面讀取為不同的字符串，在查詢字典中顯示不存在。處理方式在下篇中解決。

以上就是本文的全部內(nèi)容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: