使用 J48 解释 x 级别中感兴趣的划分属性的结果 (WEKA)

美好的

我是数据挖掘和 Weka 的新手。我使用 GUI 在 Weka 中使用 J48 构建了一个分类器,其中 J48(训练集)用于五个级别的感兴趣属性。我要评估模型的精度,但我不太清楚如何去做!一些信息可能会引起兴趣:

== Detailed Accuracy By Class ===
Precision
0.80
?
0.67
0.56
?
?

首先,我想知道“?”的含义。在精度列中。在两个级别中探测感兴趣的属性时,我没有得到“?”。这棵树现在比分成两个级别时更大。我怀疑这是否意味着在五个级别中获取感兴趣的属性会在分类和计算时间方面生成效率较低的树。这似乎很明显,因为当属性有 2 个级别时,正确分类实例的数量高达 72%。

在此先感谢您,所有有趣的答案都会得到奖励!

骑自行车的人

“我想知道精度栏中的“?”是什么意思”

请注意,对于这些相同的类别,TP 和 FP 比率为 0。J48 似乎没有将您的任何观察值分配给这些类别。

这些班级相对较小吗?如果是这样,您可能需要考虑使用 ClassBalancer 过滤器。这将使用权重使所有类看起来都相同。

当然,拿到模型后还需要“转换回”真实情况。这类似于校正物理过采样或欠采样。在此处查看我的答案:https : //stats.stackexchange.com/questions/211174/how-to-exact-prediction-from-over-sampled-dataundoing-oversampling/257507#257507

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章