在 sklearn 中预测训练数据

scutnex

我像这样使用 scikit-learn 的 SVM：

clf = svm.SVC()
clf.fit(td_X, td_y)

我的问题是，当我使用分类器来预测训练集成员的类别时，即使在 scikit-learns 实现中，分类器也会出错。（例如。clf.predict(td_X[a])==td_Y[a]）

米里亚姆·法伯

是的，运行此代码，例如：

from sklearn import svm
import numpy as np
clf = svm.SVC()
np.random.seed(seed=42)
x=np.random.normal(loc=0.0, scale=1.0, size=[100,2])
y=np.random.randint(2,size=100)
clf.fit(x,y)
print(clf.score(x,y))

得分为 0.61，因此近 40% 的训练数据被错误分类。部分原因是即使默认内核是'rbf'（理论上应该能够完美地对任何训练数据集进行分类，只要你没有两个具有不同标签的相同训练点），也有正则化来减少过拟合。默认的正则化器是C=1.0.

如果您运行与上述相同的代码但切换clf = svm.SVC()到clf = svm.SVC(C=200000)，您将获得 0.94 的准确度。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-1

我来说两句

0 条评论

登录后参与评论

上一篇：为什么kibana的可视化图表中的唯一计数不正确？

sklearn中的哪些预测模型受训练数据框中列的顺序影响？

sklearn：在管道中应用相同的缩放来训练和预测

在 sklearn 中对腌制数据执行预测

改善sklearn中的预测

在 sklearn 中预测训练数据

在 sklearn 中预测训练数据

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称