亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

利用Python讀取Excel表內容的詳細過程

 更新時間:2022年10月17日 14:48:53   作者:WYKB_Mr_Q  
python有多種方式可以去讀取excel文檔的內容,下面這篇文章主要給大家介紹了利用Python讀取Excel表內容的詳細過程,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下

用python讀取excel表中的數據

假如說有如下一張存儲了數據的excel表,其中x1-x6是特征,y_label是特征對應的類別標簽。我們想要使用python對以下數據進行數據分析,那么第一步就要先把excel表中的數據讀取出來才行。這里我們主要使用到了python中的pandas庫。

首先確定excel表存放的路徑所在,比如我的路徑是 ‘E:\relate_code\svm\dataset\data.xlsx’.

import pandas as pd

file_path = r'E:\relate_code\svm\dataset\data.xlsx'   # r對路徑進行轉義,windows需要
raw_data = pd.read_excel(file_path, header=0)  # header=0表示第一行是表頭,就自動去除了
print(raw_data)

這樣就可以取出數據了,輸出見下圖。可以看出,這里就沒有表中的x1等表頭信息了。

但是,最左邊這里還有0-169這些行號額外信息,咱們可以用以下命令只要里面的有用信息,并保存到數組中。

data = raw_data.values     # 只提取表中信息
print(data)

輸出結果:

這時候數據就都讀進來了,并且存儲為了數組形式。咱們可以選擇想要的數據,比如想把x和y分開,畢竟一個是特征,另一個是標簽,這時候可以使用以下代碼。

features = data[:, 0:6]  # 由于是二維數組,所以第一個冒號表示選擇所有行,之后0:6表示只要前六列的數據
labels = data[:, -1]     # 標簽只要最后一列

1、還可以對特征進行選擇,假如只要第四列的特征也可以使用:

feature_4 = data[: 3:4]  # 這樣得出的數組依然是二維數組,便于后續(xù)特征操作

2、如果不想要第四個特征,其它都想要,也可以這樣使用,需要用到numpy庫:

import numpy as np

feature1_3 = data[:, 0:3]   # 取前三列特征
feature5_6 = data[:, 4:6]   # 取第5,第6列特征
feature_choose = np.hstack(feature1_3, feature5_6)   # 對兩份特征進行特征拼接

這里再多說一下,np.hstack()函數和 np.vstack()函數:

這里是np.vstack()函數。主要是進行豎直堆疊,使用這個函數的時候要保證兩個數組列數是一致的(都是三列),得出的結果如下。

import numpy as np

arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))

下面是np.hstack()函數,主要是進行水平堆疊,使用這個函數的時候要保證行數是一致的(都是兩行)。

import numpy as np

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))

就先介紹到這里吧,下一篇文章介紹機器學習的代碼使用!

總結

到此這篇關于利用Python讀取Excel表內容的文章就介紹到這了,更多相關Python讀取Excel表內容內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

最新評論