在 sklearn 中预测训练数据

scutnex

我像这样使用 scikit-learn 的 SVM:

clf = svm.SVC()
clf.fit(td_X, td_y) 

我的问题是,当我使用分类器来预测训练集成员的类别时,即使在 scikit-learns 实现中,分类器也会出错。(例如。clf.predict(td_X[a])==td_Y[a]

米里亚姆·法伯

是的,运行此代码,例如:

from sklearn import svm
import numpy as np
clf = svm.SVC()
np.random.seed(seed=42)
x=np.random.normal(loc=0.0, scale=1.0, size=[100,2])
y=np.random.randint(2,size=100)
clf.fit(x,y)
print(clf.score(x,y))

得分为 0.61,因此近 40% 的训练数据被错误分类。部分原因是即使默认内核是'rbf'(理论上应该能够完美地对任何训练数据集进行分类,只要你没有两个具有不同标签的相同训练点),也有正则化来减少过拟合。默认的正则化器是C=1.0.

如果您运行与上述相同的代码但切换clf = svm.SVC()clf = svm.SVC(C=200000),您将获得 0.94 的准确度。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

sklearn中的哪些预测模型受训练数据框中列的顺序影响?

sklearn:在管道中应用相同的缩放来训练和预测

在 sklearn 中对腌制数据执行预测

改善sklearn中的预测

在训练数据标准化之后使用sklearn预测新数据

如何使用 sklearn KNeighborsClassifier 传递数据集的单个特征进行训练并预测值?

保存的 sklearn 模型的预测与经过训练的模型不同

使用sklearn预测多标签数据

如何使用sklearn中训练有素的NB分类器来预测电子邮件的标签?

Sklearn预测多个输出

如何在 DeepChem 中训练 sklearn 模型?

如何按日期拆分数据并使用 sklearn 中的 sklift 进行预测?

使用 sklearn 从多个数据样本中整理概率、预测、系数

sklearn中的GridSearchCV是否使用整个数据集训练模型?

Sklearn训练数据和测试数据的大小不同

sklearn如何使用多个保存的模型合并和预测数据

如何在 sklearn 中转换数据点以进行预测

深度学习:如何使用 skLearn 缩放预测数据 - MinMaxScaler()

如何使用sklearn训练算法加权数据点

拆分数据帧以进行训练和测试 SKlearn

Sklearn svm预测相同的值

SKlearn预测尾巴而不是头部

与sklearn并行训练多个模型?

如何从sklearn MLPClassifier训练的神经网络中使用Syncfusion PMML进行预测?

sklearn SGDClassifier无法使其确定性地进行训练或预测

如何基于sklearn中的预测概率对实例进行排名

如何在sklearn中获得关于隔离林的顶级预测

Sklearn模型系数并预测linear_model中的不匹配

如何在sklearn中缩放单个样本以进行预测?