使用新数据更新决策树

用户名

我是决策树的新手。我正计划构建一个大型决策树,我希望稍后使用其他数据进行更新。最好的方法是什么?以后可以更新任何决策树吗?

琼诺

决策树最常接受所有可用数据的训练。也就是说,当您拥有新数据时,您将重新训练整个树。由于此过程非常快,因此通常不会出现问题。如果数据太大而无法容纳在内存中,则通常可以通过对训练集进行二次采样(行采样)来解决它,因为基于树的模型不需要那么多数据就可以得到良好的结果。

请注意,决策树非常适合过度拟合,因此您应该考虑使用随机森林或其他集成方法。使用装袋,可以在不同的数据子集上训练不同的树。

还存在用于决策树的增量和在线学习方法。CART,ID3和VFDT学习器是一些示例。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章