sklearn.ensemble.RandomForestClassifier 输出不一致

迈尔斯·班尼特·戴森

我有一个训练有素的 sklearn 随机森林多标签分类器，在训练集中，始终存在一个类，这意味着您希望分类器始终为该类返回 1。发生这种情况，但是分类器返回 [1] 而不是 [0, 1]。见下面的输出：

[array([[0.05, 0.95]]), array([[0.97, 0.03]]), 
array([[0.95, 0.05]]), array([[1., 0.]]), array([[1., 0.]]), 
array([[1., 0.]]), array([[0.65, 0.35]]), array([[1.]])]

为什么会出现这种情况，我该如何防止这种情况发生？在示例中，它是仅单个输入的结果，但是在我的情况下，我有一个完整的数据框作为输入，我将其转换为类预测。如果其中一个数组只有一个维度，则这是不可能的：[1] 而不是像其他类的预测那样的二维 [0,1]。

这可以通过 sklearn 中的设置进行更改吗？

额外说明为什么我有一个只有正类样本的训练集：这是推荐系统的一部分，有时每种类型的客户每次都会购买产品。

迈尔斯·班尼特·戴森

我使用简单的列表理解检查解决了它，该检查将第二列添加到不一致的输出数组中。执行此操作的代码如下，其中 rfc_output 是存在不一致列的随机森林输出。

rfc_output = [np.c_[x, np.zeros(window_size)] if len(x[1])<2 else x for x in rfc_output ]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-05-28

我来说两句

0 条评论

登录后参与评论

上一篇：Python对象初始化和方法评估的顺序

TOP 榜单

文章

sklearn.ensemble.RandomForestClassifier 输出不一致

sklearn.ensemble.RandomForestClassifier 输出不一致

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException