计算分类准确性的最佳方法?

简单梦想

我知道一个计算分类准确度的公式是X = t / n * 100(其中t是正确分类的数量,n是样本总数。)

但是,假设我们总共有100个样本,A类为80个,B类为10个,C类为10个。

方案1:将所有100个样本分配到A类,通过使用公式,我们得出的准确度等于80%。

方案2:属于B的10个样本被正确分配到B类;也属于C的10个样本也被正确分配到C类;属于A的30个样本正确分配给A类;其余50个属于A的样本被错误地分配给C。通过使用该公式,我们获得了50%的准确度。

我的问题是:

1:可以说方案1的准确率比方案2高吗?

2:有什么方法可以计算分类问题的准确率?

非常感谢!

凯文·马克汉姆(Kevin Markham)

分类准确性定义为“正确预测的百分比”。无论类数如何,都是这种情况。因此,方案1比方案2具有更高的分类精度。

但是,听起来您真正要问的是一种替代评估指标或流程,该奖励或流程“奖励”方案2仅用于犯某些类型的错误。我有两个建议:

  1. 创建一个混淆矩阵:它描述了分类器的性能,以便您可以查看分类器犯下的错误类型。
  2. 计算每个班级的精度,召回率和F1分数。F1的平均分数可能是您要查找的单数指标。

即使您不是scikit-learn用户,scikit-learn文档分类指标部分也提供了许多有关分类器评估的良好信息。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章