import os
path= "./data" #路徑
files = os.listdir(path)
#os.listdir() 方法用于返回指定的文件夾包含的文件或文件夾的名字的列表。
for file in files:
? ? print(file)
? ? if os.path.isfile(path+ "/"+file):
? ? ? ? #os.path.isfile(path) 判斷路徑是否為文件
? ? ? ? print('file'+'這是一個文件')
? ? ? ? filename,extension = os.path.splitext(file)
? ? ? ? #分割路徑，返回路徑名和文件擴展名的元組
? ? ? ? if extension == ".txt":
? ? ? ? ? ? print(filename+'這是一個文本文件')
? ? ? ? elif extension == ".xlsx":
? ? ? ? ? ? print(filename+'這是一個excel文件')
? ? if os.path.isdir(path + "/" +file):
? ? ? ? print(file+"是一個文件夾")

讀取結果:

二、使用Python完整的獲取所有文件及文件夾并讀取相應的文件

在我們遍歷文件夾的基礎上，如何實現(xiàn)快速讀取指定文件，提高工作效率？
只需要在上述代碼的基礎上，導入pandas包，read_excel_我們所需要的文件即可

import pandas as pd
import os?
path = './data'
def get_all_files(path):
? ? print('-'*25+'函數(shù)被調(diào)用'+'-'*25)
? ? files = os.listdir(path)
#os.listdir() 方法用于返回指定的文件夾包含的文件或文件夾的名字的列表。
? ? for file in files:
? ? ? ? if os.path.isfile(path+ "/"+file):
? ? ? ? ? ? #os.path.isfile(path) 判斷路徑是否為文件
? ? ? ? ? ? print('file'+">>>>>是文件")
? ? ? ? ? ? filename,extension = os.path.splitext(file)
? ? ? ? ? ? #分割路徑，返回路徑名和文件擴展名的元組
? ? ? ? ? ? if extension == ".txt":
? ? ? ? ? ? ? ? print(filename+"#####是文本文件#####")
? ? ? ? ? ? ? ? print("讀取"+filename+"文件中的內(nèi)容...........")
? ? ? ? ? ? ? ? data = pd.read_table(path+'/'+file)
? ? ? ? ? ? ? ? print(data)
? ? ? ? ? ? elif extension == ".xlsx":
? ? ? ? ? ? ? ? print(filename+'#####是Excel文件#####')
? ? ? ? ? ? ? ? print("讀取"+filename+"文件中的內(nèi)容...........")
? ? ? ? ? ? ? ? data = pd.read_excel(path+'/'+file)
? ? ? ? ? ? ? ? print(data)
? ? ? ? ? ? elif extension == ".csv":
? ? ? ? ? ? ? ? print(filename+'#####是csv文件#####')
? ? ? ? ? ? ? ? print("讀取"+filename+"文件中的內(nèi)容...........")
? ? ? ? ? ? ? ? data = pd.read_csv(path+'/'+file)
? ? ? ? ? ? ? ? print(data)
? ? ? ? if os.path.isdir(path + "/" +file):
? ? ? ? ? ? print(file+"￥￥￥￥￥￥￥是文件夾￥￥￥￥￥￥￥")
? ? ? ? ? ? get_all_files(path+'/'+file)
get_all_files(path) ? ?

讀取成功！

三、使用Python合并數(shù)據(jù)

在日常工作中我們有很多表格需要處理，如何批量的將很多個文件夾中的表格合并到一起？

重點：

DataFrame.append(*other*, *ignore_index=False*, *verify_integrity=False*, *sort=None*)

append的使用

other: 是要添加的數(shù)據(jù)，append很不挑食，這個other可以是dataframe，dict，Seris，list等等。
ignore_index: 參數(shù)為True時將在數(shù)據(jù)合并后，按照0，1，2，3....的順序重新設置索引，忽略了舊索引。
verify_integrity：參數(shù)為True時，如果合并的數(shù)據(jù)與原數(shù)據(jù)包含索引相同的行，將報錯。

path='./project_data'
?## 聲明一個空的DataFrame，用來做最終的數(shù)據(jù)合并
final_data = pd.DataFrame()
# 聲明一個空的DataFrame，用來做最終的數(shù)據(jù)合并
final_data = pd.DataFrame()
?
def get_all_files(path):
? ? global final_data
? ? print("-"*20 + "函數(shù)被調(diào)用" + "-"*20)
? ? files = os.listdir(path)
? ? for file in files:
? ? ? ? if os.path.isfile(path + "/" +file):
? ? ? ? ? ? print(file+">>>>>是文件")
? ? ? ? ? ? filename,extension=os.path.splitext(file)
? ? ? ? ? ? # 判斷是不是文本文件
? ? ? ? ? ? if extension == ".txt" :
? ? ? ? ? ? ? ? print(filename+"#####是文本文件#####")
? ? ? ? ? ? ? ? print("讀取"+filename+"文件中的內(nèi)容...........")
? ? ? ? ? ? ? ? data = pd.read_table(path+'/' +file)
? ? ? ? ? ? ? ? print(data)
? ? ? ? ? ? elif extension=='.xlsx':
? ? ? ? ? ? ? ? print(filename+"#####是Excel文件#####")
? ? ? ? ? ? ? ? print("讀取"+filename+"文件中的內(nèi)容...........")
? ? ? ? ? ? ? ? data = pd.read_excel(path+'/' +file)
? ? ? ? ? ? ? ? print(data)
? ? ? ? ? ? elif extension=='.csv':
? ? ? ? ? ? ? ? print(filename + "是csv文件，是本次需要處理的文件")
? ? ? ? ? ? ? ? # 獲取文件內(nèi)容
? ? ? ? ? ? ? ? file_data = pd.read_csv(path +'/'+file)
? ? ? ? ? ? ? ? final_data = final_data.append(file_data,ignore_index=True)
? ? ? ? ? ? ? ? #append描述：在列表ls最后(末尾)添加一個元素object
? ? ? ? ? ? ? ? print("《《《《合并"+filename+"文件數(shù)據(jù)》》》》")
? ? ? ? ? ? ? ??
? ? ? ? # 判斷是不是文件夾
? ? ? ? elif os.path.isdir(path+'/'+file):
? ? ? ? ? ? print(file + "￥￥￥￥是文件夾￥￥￥￥￥￥")
? ? ? ? ? ? get_all_files(path + '/' + file)
get_all_files(path)
print("數(shù)據(jù)合并完成")