本网站(662p.com)打包出售,且带程序代码数据,662p.com域名,程序内核采用TP框架开发,需要联系扣扣:2360248666 /wx:lianweikj
精品域名一口价出售:1y1m.com(350元) ,6b7b.com(400元) , 5k5j.com(380元) , yayj.com(1800元), jiongzhun.com(1000元) , niuzen.com(2800元) , zennei.com(5000元)
需要联系扣扣:2360248666 /wx:lianweikj
Python实现SVM支持向量机的示例代码
iamgeek · 124浏览 · 发布于2023-06-25 +关注

SVM 的目的是在数据集中找到一条最佳分隔超平面,使得在这个超平面两侧的数据分别属于不同的类别,且该超平面与最近的数据点之间的距离最大。本文将通过Python实现SVM支持向量机,感兴趣的可以了解一下


下面是使用 scikit-learn 库中的 SVM 模型的示例代码:

from sklearn import svm
from sklearn.datasets import make_classification
 
# generate some example data
X, y = make_classification(n_features=4, random_state=0)
 
# fit an SVM model to the data
clf = svm.SVC(kernel='linear')
clf.fit(X, y)
 
# predict new data
print(clf.predict([[0, 0, 0, 0]]))

什么是支持向量机

支持向量机(SVM),SVM 的目的是在数据集中找到一条最佳分隔超平面,使得在这个超平面两侧的数据分别属于不同的类别,且该超平面与最近的数据点之间的距离最大。

这些最近的数据点称为支持向量,因此该模型被称为支持向量机。

SVM 可以处理线性可分和线性不可分的情况,也可以通过使用核函数来处理非线性问题。

SVM 在解决分类问题时,通常是通过构造一个最大间隔分离超平面来实现的。

在回归问题中,SVM 通过构造一个回归超平面来实现预测。

SVM 的核心思想是利用数学方法将高维数据映射到低维空间,从而对不可分数据进行线性分类。

SVM 模型具有很好的泛化能力,可以解决高维数据的分类问题。

SVM 模型可以使用不同的核函数,如线性核、多项式核、高斯核等,这样可以解决非线性问题。此外,SVM 还可以处理大量特征数据,并具有高效的计算速度。

用 Python 实现 SVM

使用 scikit-learn 库实现 SVM 分类

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
 # 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]
 # 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
 # 创建 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)
 # 训练模型
model.fit(X_train, y_train)
 # 在测试集上进行预测
y_pred = model.predict(X_test)
 # 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

首先使用 load_iris() 函数加载 iris 数据集,然后使用 train_test_split() 函数将数据集划分为训练集和测试集。

接着,使用 SVC 函数创建一个 SVM 模型,并使用 fit() 函数在训练集上进行训练。

最后,使用 predict 函数在测试集上进行预测,并使用 accuracy_score() 函数计算预测精度。

多项式和高斯核函数的 SVM

使用高斯核函数的 SVM 可以如下实现:

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
 # 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]
 # 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
 # 创建 SVM 模型,使用高斯核函数
model = SVC(kernel='rbf', C=1, random_state=0)
 # 训练模型
model.fit(X_train, y_train)
 # 在测试集上进行预测
y_pred = model.predict(X_test)
 # 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的代码中,首先加载了 scikit-learn 中的 iris 数据集,并将其特征数据存储在 X 中,标签存储在 y 中。

使用 train_test_split() 函数划分出了训练集和测试集,并将其分别存储在 X_train , X_test , y_train , y_test 中。

创建了一个 SVM 模型,使用了高斯核函数(Radial basis function, RBF)。参数 C 用于控制对误差的惩罚程度,数值越大,惩罚程度越大。参数 gamma 控制高斯核函数的影响范围,数值越小,影响范围越广。

使用 fit() 方法训练模型。训练后,使用 predict() 方法在测试集上进行预测,并将预测结果存储在 y_pred 中。

最终的结果将通过 accuracy_score() 函数计算预测精度,并将其打印出来。

还可以调整 SVM 模型的超参数以改变模型的表现,例如 C 和 gamma 。通过调整超参数可以使模型更加适合数据,并提高模型的预测精度。


相关推荐

PHP实现部分字符隐藏

沙雕mars · 1325浏览 · 2019-04-28 09:47:56
Java中ArrayList和LinkedList区别

kenrry1992 · 908浏览 · 2019-05-08 21:14:54
Tomcat 下载及安装配置

manongba · 970浏览 · 2019-05-13 21:03:56
JAVA变量介绍

manongba · 963浏览 · 2019-05-13 21:05:52
什么是SpringBoot

iamitnan · 1087浏览 · 2019-05-14 22:20:36
加载中

0评论

评论
努力追求卓越,极致,这么一个GEEK人,希望可以跟大家认识,交流一下。
分类专栏
小鸟云服务器
扫码进入手机网页