Theory 说将数据集分成三组:训练集用于训练模型,验证集用于调整参数,测试集用于评估性能。
但是,已经有 GridSearchCV 对训练集进行交叉验证以找到最佳参数。但是我如何使用我自己的验证集来调整参数?
我有 10 个班级,对于训练数据,每个班级有 1017 个样本。在验证和测试集中,每个类都有 300 个样本。
我已经在火车数据上训练了我的分类。
clf = RandomForestClassifier(random_state=97)
clf.fit(train, np.array(train_lab))
如何使用我的验证集调整参数?我发现仅使用 GridSearchCV 作为交叉验证的示例。但是我想避免它并在我自己的验证集上调整模型。我该怎么做?
您可以将交叉验证对象传递到GridSearchCV
. 传入一个PredefinedSplit
对象,它可以让您决定训练集和验证集是什么。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句