如何使用 scikit learn 预测目标标签

购买迪普

假设我有一个数据集,我将在这个例子中提供一个玩具示例......

data = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
target = "A"

...产生...

        A   B   C   D
    0  75  38  81  58
    1  36  92  80  79
    2  22  40  19  3
       ...    ...

这显然是不足够的数据来提供一个良好的精度,但尽管如此,让我们说我喂datatarget一个random forest提供的算法scikit学习...

def random_forest(target, data):

    # Drop the target label, which we save separately.
    X = data.drop([target], axis=1).values
    y = data[target].values

    # Run Cross Validation on Random Forest Classifier.
    clf_tree = ske.RandomForestClassifier(n_estimators=50)
    unique_permutations_cross_val(X, y, clf_tree)

unique_permutations_cross_val 只是我制作的交叉验证函数,这就是函数(它也打印出模型的准确性)...

def unique_permutations_cross_val(X, y, model):

    # Split data 20/80 to be used in a K-Fold Cross Validation with unique permutations.
    shuffle_validator = model_selection.ShuffleSplit(n_splits=10, test_size=0.2, random_state=0)

    # Calculate the score of the model after Cross Validation has been applied to it. 
    scores = model_selection.cross_val_score(model, X, y, cv=shuffle_validator)

    # Print out the score (mean), as well as the variance.
    print("Accuracy: %0.4f (+/- %0.2f)" % (scores.mean(), scores.std()))

无论如何,我的主要问题是,如何使用我创建的这个模型预测目标标签。例如,假设我给模型喂食[28, 12, 33]我希望模型预测target在这种情况下是"A"

维维克·库马尔

发布代码中的此模型尚未安装。您进行了交叉验证,这将告诉您模型在您的数据上的训练效果如何(或不是),但它不会像您想要的那样适合模型对象。cross_val_score()使用提供的模型对象的克隆来查找分数。

为了预测数据,您需要显式调用fit()模型。

因此,也许您可​​以编辑random_forest方法以返回拟合模型。像这样的东西:

unique_permutations_cross_val(X, y, clf_tree)
clf_tree.fit(X, y)
return clf_tree

然后无论您在何处调用该random_forest方法,都可以执行以下操作:

fitted_model = random_forest(target, data)

predictions = fitted_model.predict([data to predict])

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用scikit-learn评估预测的置信度得分

如何使用 SciKit-Learn 预测新的房价?

如何在scikit-learn中预测时间序列?

scikit-learn:如何缩减“ y”预测结果

Scikit-Learn:如何检索KFold CV的预测概率?

Scikit-Learn:使用DBSCAN预测新点

使用scikit-learn预测单个值会导致ValueError

使用scikit-learn预测有趣的文章

使用scikit-learn的Imputer模块预测缺失值

使用scikit-learn预测电影评论

在使用scikit-learn测试多类svm时,如何找到预测的置信度?

如何在scikit-learn中使用交叉验证来获得预测概率

如何使用Scikit-Learn包装器获得XGBoost和XGBoost的预测以进行匹配?

Scikit-Learn:如何使用矩阵 X 的变换来变换目标变量 Y

总结 Scikit-Learn 的线性回归的预测

Scikit Learn中用于预测的扩展功能

Scikit-learn - 我在预测什么?

如何使用python中的scikit Learn使用线性回归预测来填充大熊猫数据框中的NA值?

如何在scikit-learn中提高预测的准确性

如何在Scikit-Learn中重用LabelBinarizer进行输入预测

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

在使用scikit_learn和pandas训练模型后,如何预测未来的数据(以我的情况为例)?

使用scikit-learn可以在给定“ y”的情况下预测数据向量“ x”?

使用 scikit learn 训练机器学习模型以进行时间序列预测

使用decision_function_shape='ovo'从scikit-learn SVC decision_function 预测概率

有什么办法可以在Python中使用scikit-learn来预测每月的时间序列?

Scikit-Learn / Pandas:根据用户输入使用保存的模型进行预测

在scikit-learn中获得多标签预测的准确性

Scikit-learn 微调:在评估前对预测标签进行后处理