在python中训练randomforest时,哪个dtype效果更好?

Chasen Li

我试图randomforest在python中训练分类器。但是,在我的原著中pandas.dataframe,有float64,object,datetime64,int64和bool dtypes(几乎所有在熊猫中允许的dtypes)。

  • 是否有必要将布尔值转换floatint
  • 对于二值对象列,我应该将其转换为boolintfloat吗?哪一个效果更好?还是没关系?

谢谢!

jakevdp

几乎所有scikit-learn估计器都将在运行算法之前将输入数据转换为float,而不管阵列中的原始类型如何。这适用于随机森林实施。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

哪个是训练图像的更好方法

在python,del或delattr中哪个更好?

哪个效果更好?SQL Server 中的事务还是 C# 中的事务?

如果与Python中的Elif相比,哪个更好?

从R中经过训练的randomForest中获取因子水平

阶乘中哪种模板使用效果更好

同步方法或同步块:在java中编写单例类时哪个更好?

在比较两个异常对象时,ShouldBe 和 ShouldEqual 中哪个更好

Java中的代码重构,当有多个声明和操作时哪个更好?

在python中使用( a not in b )或( not a in b )哪个更好?

DDD中的领域对象建模哪个更好?

UIImageView setImage或setBackgroundColor,在iOS中哪个更好

在Hive中,哪个查询更好,为什么?

Java中HashMap的getOrDefault()或putIfAbsent()哪个更好

在Ejabberd中,哪个MySQL和Mnesia更好?

MySQL 中哪个更好,IFNULL 或 OR 逻辑

哪个更好:Rails中的常量或模型

在Python中训练TBL POS Tagger时出现内存错误

Spark RandomForest 训练 StackOverflow 错误

训练模型时出现张量流错误 - 标签 dtype 应该是整数而不是 <dtype: 'string'>

randomForest **有时**在训练数据集上预测()s NA

在使用插入式的train()使用公式训练的randomForest对象上使用predict()时出错

当我们要求用户再做一次或完成时,哪个更好用?在 Java 中

文本分类 - randomForest。newdata 中缺失的训练数据中的变量

在评估 Precision 或 Recall 模型的质量时,使用哪个更好?

如何根据提供的输入从训练有素的 RandomForest 模型中获取单个房价

在Python中使用XGboost_Regressor会产生很好的训练效果,但预测效果很差

在python条件下使用(不在)和(不在)哪个更好?

存储在数组还是字段中?哪个更好?