如何提高随机森林多类分类模型的准确性？

code_crusher 发表于 Dev

58

code_crusher

我正在进行多类别分类，以便根据客户的购买行为和人口统计将其分为3个不同的类别。我无法完全公开数据集，但通常它包含大约300个要素和50000行。我尝试了以下方法，但无法达到50％以上的精度：

调整超参数（我在执行GridSearchCV之后使用调整的超参数）
标准化数据集，然后运行我的模型
尝试了不同的分类方法：OneVsRestClassifier，RandomForestClassification，SVM，KNN和LDA
我还删除了不相关的功能并尝试运行模型
我的班级不平衡，因此我也尝试过使用class_weight =平衡，使用SMOTE进行过采样，下采样和重采样。

还有什么我可以尝试提高准确性的（准确度是指f分数，精度和召回率）。

任何帮助将不胜感激。

Rishi Bansal

尝试调整以下参数

n_估计量

这是在进行最大投票或预测平均值之前要构建的树数。树的数量越多，性能越好，但是代码却变慢。您应该选择处理器可以处理的尽可能高的价值，因为这会使您的预测更强大，更稳定。由于数据量较大，因此每次迭代都将花费更多时间，但是请尝试这样做。

max_features

这些是随机森林允许在单个树中尝试的最大功能数。Python中有多个可用选项来分配最大功能。其中很少有：

自动/无：这将简单地采用所有
在每棵树上有意义的功能，这里我们对单个树没有任何限制。

sqrt：此选项将以单个运行中要素总数的平方根为单位。例如，如果变量总数为100，则在单个树中只能容纳10个变量。“ log2”是max_features的另一种相似类型的选项。

0.2：此选项允许随机森林在每次运行中获取20％的变量。我们可以以“ 0.x”格式分配和赋值，其中我们希望考虑x％的特征。

min_sample_leaf

叶子是决策树的末端节点。较小的叶子使模型更易于捕获火车数据中的噪声。您可以从一些最小值开始，例如75，然后逐渐增加它。看看您的精度达到哪个值。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-18

我来说两句

0 条评论

登录后参与评论

上一篇：Azure DevOps：版本变量类型

相关文章

随机森林提高准确性

Keras：模型之间的分类报告准确性不同。多类的预测准确性

新手：如何评估模型以提高分类模型的准确性

提高二元分类模型的准确性

提高多类别图像分类器的准确性

如何修改图层/模型以提高模型的准确性？

张量流中处理多类多标签分类时如何计算准确性？

R中二进制分类的随机森林截断和准确性度量

如何提高模型损失和准确性？

如何在Python中获取多类分类问题的相邻准确性得分？

Keras如何计算多类别分类问题的验证准确性和训练准确性？

获取R中随机森林的准确性

为什么改组训练数据会影响我的随机森林分类器的准确性？

如何提高读取tesseract的准确性？

如何提高LSTM训练的准确性

如何在Keras中提高CNN分类器的准确性？

Keras：模型。评估与模型。预测多类NLP任务中的准确性差异

在keras模型指标中使用简单的“准确性”进行多类分类在技术上是否错误？我们应该使用CategoricalAccuracy（）吗？

提高WEKA多层感知器模型的准确性

如何使用sklearn从决策树模型提高预测的准确性？

仅当验证准确性提高时，如何才能保存/覆盖我的TensorFlow / Keras模型？

如何提高模型的准确性？（猫vs狗图像识别）

Tensorflow如何计算模型的准确性？

如何使用tf.metrics计算多标签分类的准确性？

多标签分类keras的怪异准确性

如何在深度学习中提高准确性和验证准确性

在Python中用于文本分类的随机森林，非线性SVC和多项式NB的每次运行获得不同的准确性

如何提高这种图像的tesseract准确性？

如何提高Watson Speech to Text的准确性？

TOP 榜单

文章

热门标签

归档