在python中训练randomforest时，哪个dtype效果更好？

Chasen Li 发表于 Dev

15

Chasen Li

我试图randomforest在python中训练分类器。但是，在我的原著中pandas.dataframe，有float64，object，datetime64，int64和bool dtypes（几乎所有在熊猫中允许的dtypes）。

是否有必要将布尔值转换为float或int？
对于二值对象列，我应该将其转换为bool，int或float吗？哪一个效果更好？还是没关系？

谢谢！

jakevdp

几乎所有scikit-learn估计器都将在运行算法之前将输入数据转换为float，而不管阵列中的原始类型如何。这适用于随机森林实施。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-25

我来说两句

0 条评论

登录后参与评论

上一篇：Kotlin协程-异步等待

相关文章

哪个是训练图像的更好方法

在python，del或delattr中哪个更好？

哪个效果更好？SQL Server 中的事务还是 C# 中的事务？

如果与Python中的Elif相比，哪个更好？

从R中经过训练的randomForest中获取因子水平

阶乘中哪种模板使用效果更好

同步方法或同步块：在java中编写单例类时哪个更好？

在比较两个异常对象时，ShouldBe 和 ShouldEqual 中哪个更好

Java中的代码重构，当有多个声明和操作时哪个更好？

在python中使用（ a not in b ）或（ not a in b ）哪个更好？

DDD中的领域对象建模哪个更好？

UIImageView setImage或setBackgroundColor，在iOS中哪个更好

在Hive中，哪个查询更好，为什么？

Java中HashMap的getOrDefault（）或putIfAbsent（）哪个更好

在Ejabberd中，哪个MySQL和Mnesia更好？

MySQL 中哪个更好，IFNULL 或 OR 逻辑

哪个更好：Rails中的常量或模型

在Python中训练TBL POS Tagger时出现内存错误

Spark RandomForest 训练 StackOverflow 错误

训练模型时出现张量流错误 - 标签 dtype 应该是整数而不是 <dtype: 'string'>

randomForest 有时在训练数据集上预测()s NA

在使用插入式的train（）使用公式训练的randomForest对象上使用predict（）时出错

当我们要求用户再做一次或完成时，哪个更好用？在 Java 中

文本分类 - randomForest。newdata 中缺失的训练数据中的变量

在评估 Precision 或 Recall 模型的质量时，使用哪个更好？

如何根据提供的输入从训练有素的 RandomForest 模型中获取单个房价

在Python中使用XGboost_Regressor会产生很好的训练效果，但预测效果很差

在python条件下使用（不在）和（不在）哪个更好？

存储在数组还是字段中？哪个更好？

TOP 榜单

文章

热门标签

归档