为什么我的 CatBoost 拟合指标与 sklearn 评估指标不同？

dekio 发表于 Dev

十

我仍然不确定这应该是这个论坛或交叉验证的问题，但我会尝试这个，因为它更多地是关于代码的输出而不是技术本身。事情是这样的，我正在运行一个 CatBoost 分类器，就像这样：

# import libraries
import pandas as pd
from catboost import CatBoostClassifier
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score
from sklearn.model_selection import train_test_split    

# import data
train = pd.read_csv("train.csv")

# get features and label
X = train[["Pclass", "Sex", "SibSp", "Parch", "Fare"]]

y = train[["Survived"]]

# split into train and test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# model parameters 
model_cb = CatBoostClassifier(
    cat_features=["Pclass", "Sex"],
    loss_function="Logloss",
    eval_metric="AUC",
    learning_rate=0.1,
    iterations=500,
    od_type = "Iter",
    od_wait = 200
)

# fit model
model_cb.fit(
    X_train,
    y_train,
    plot=True,
    eval_set=(X_test, y_test),
    verbose=50,
)

y_pred = model_cb.predict(X_test)

print(f1_score(y_test, y_pred, average="macro"))

print(roc_auc_score(y_test, y_pred))

我使用的数据框来自泰坦尼克号比赛（链接）。

问题是 model_cb.fit 步骤显示的 AUC 为 0.87，但最后一行，来自 sklearn 的 roc_auc_score 显示的 AUC 为 0.73，即低得多。根据我的理解，CatBoost 的 AUC 应该已经在测试数据集中了。

关于这里的问题以及我该如何解决的任何想法？

本清洁工

ROC 曲线需要预测概率或某种其他类型的置信度度量，而不是硬类预测。使用

y_pred = model_cb.predict_proba(X_test)[:, 1]

参见Scikit-learn : roc_auc_score和为什么 roc_curve 只返回 3 个值？.

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-22

我来说两句

0 条评论

登录后参与评论

上一篇：无法使用 open_file 包 flutter 打开文件

如何为Catboost创建自定义评估指标？

如何在 sklearn 的拟合函数中选择要优化的指标？

xgboost Python 中验证集中的评估指标与我在进行预测时得到的指标不同

为什么我的 CatBoost 拟合指标与 sklearn 评估指标不同？

为什么我的 CatBoost 拟合指标与 sklearn 评估指标不同？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局