快捷導(dǎo)航

Python實(shí)現(xiàn)SVM支持向量機(jī)的示例代碼

更新時(shí)間：2023年02月06日 08:41:24 作者：夢(mèng)想橡皮擦

SVM 的目的是在數(shù)據(jù)集中找到一條最佳分隔超平面，使得在這個(gè)超平面兩側(cè)的數(shù)據(jù)分別屬于不同的類(lèi)別，且該超平面與最近的數(shù)據(jù)點(diǎn)之間的距離最大。本文將通過(guò)Python實(shí)現(xiàn)SVM支持向量機(jī)，感興趣的可以了解一下

什么是支持向量機(jī)

支持向量機(jī)（SVM），SVM 的目的是在數(shù)據(jù)集中找到一條最佳分隔超平面，使得在這個(gè)超平面兩側(cè)的數(shù)據(jù)分別屬于不同的類(lèi)別，且該超平面與最近的數(shù)據(jù)點(diǎn)之間的距離最大。

這些最近的數(shù)據(jù)點(diǎn)稱(chēng)為支持向量，因此該模型被稱(chēng)為支持向量機(jī)。

SVM 可以處理線(xiàn)性可分和線(xiàn)性不可分的情況，也可以通過(guò)使用核函數(shù)來(lái)處理非線(xiàn)性問(wèn)題。

SVM 在解決分類(lèi)問(wèn)題時(shí)，通常是通過(guò)構(gòu)造一個(gè)最大間隔分離超平面來(lái)實(shí)現(xiàn)的。

在回歸問(wèn)題中，SVM 通過(guò)構(gòu)造一個(gè)回歸超平面來(lái)實(shí)現(xiàn)預(yù)測(cè)。

SVM 的核心思想是利用數(shù)學(xué)方法將高維數(shù)據(jù)映射到低維空間，從而對(duì)不可分?jǐn)?shù)據(jù)進(jìn)行線(xiàn)性分類(lèi)。

SVM 模型具有很好的泛化能力，可以解決高維數(shù)據(jù)的分類(lèi)問(wèn)題。

SVM 模型可以使用不同的核函數(shù)，如線(xiàn)性核、多項(xiàng)式核、高斯核等，這樣可以解決非線(xiàn)性問(wèn)題。此外，SVM 還可以處理大量特征數(shù)據(jù)，并具有高效的計(jì)算速度。

用 Python 實(shí)現(xiàn) SVM

使用 scikit-learn 庫(kù)實(shí)現(xiàn) SVM 分類(lèi)

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加載數(shù)據(jù)集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓(xùn)練集和測(cè)試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 創(chuàng)建 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)

# 訓(xùn)練模型
model.fit(X_train, y_train)

# 在測(cè)試集上進(jìn)行預(yù)測(cè)
y_pred = model.predict(X_test)

# 計(jì)算預(yù)測(cè)精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

首先使用 load_iris() 函數(shù)加載 iris 數(shù)據(jù)集，然后使用 train_test_split() 函數(shù)將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集。

接著，使用 SVC 函數(shù)創(chuàng)建一個(gè) SVM 模型，并使用 fit() 函數(shù)在訓(xùn)練集上進(jìn)行訓(xùn)練。

最后，使用 predict 函數(shù)在測(cè)試集上進(jìn)行預(yù)測(cè)，并使用 accuracy_score() 函數(shù)計(jì)算預(yù)測(cè)精度。

多項(xiàng)式和高斯核函數(shù)的 SVM

使用高斯核函數(shù)的 SVM 可以如下實(shí)現(xiàn)：

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加載數(shù)據(jù)集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓(xùn)練集和測(cè)試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 創(chuàng)建 SVM 模型，使用高斯核函數(shù)
model = SVC(kernel='rbf', C=1, random_state=0)

# 訓(xùn)練模型
model.fit(X_train, y_train)

# 在測(cè)試集上進(jìn)行預(yù)測(cè)
y_pred = model.predict(X_test)

# 計(jì)算預(yù)測(cè)精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的代碼中，首先加載了 scikit-learn 中的 iris 數(shù)據(jù)集，并將其特征數(shù)據(jù)存儲(chǔ)在 X 中，標(biāo)簽存儲(chǔ)在 y 中。

使用 train_test_split() 函數(shù)劃分出了訓(xùn)練集和測(cè)試集，并將其分別存儲(chǔ)在 X_train ， X_test ， y_train ， y_test 中。

創(chuàng)建了一個(gè) SVM 模型，使用了高斯核函數(shù)（Radial basis function, RBF）。參數(shù) C 用于控制對(duì)誤差的懲罰程度，數(shù)值越大，懲罰程度越大。參數(shù) gamma 控制高斯核函數(shù)的影響范圍，數(shù)值越小，影響范圍越廣。

使用 fit() 方法訓(xùn)練模型。訓(xùn)練后，使用 predict() 方法在測(cè)試集上進(jìn)行預(yù)測(cè)，并將預(yù)測(cè)結(jié)果存儲(chǔ)在 y_pred 中。

最終的結(jié)果將通過(guò) accuracy_score() 函數(shù)計(jì)算預(yù)測(cè)精度，并將其打印出來(lái)。

還可以調(diào)整 SVM 模型的超參數(shù)以改變模型的表現(xiàn)，例如 C 和 gamma 。通過(guò)調(diào)整超參數(shù)可以使模型更加適合數(shù)據(jù)，并提高模型的預(yù)測(cè)精度。

到此這篇關(guān)于Python實(shí)現(xiàn)SVM支持向量機(jī)的示例代碼的文章就介紹到這了,更多相關(guān)Python SVM支持向量機(jī)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: