Sklearn Fit模型多次

马塞尔·玛斯

问题的根源很普遍:

存在大量火车数据,这些数据是按块读取的。兴趣点是将所需模型顺序拟合到分块数据集上,并保持先前​​拟合的状态。

除了partial_fit()在不同数据上使用sklearn拟合模型之外是否还有其他方法还是有任何技巧可以重写fit()功能代码以针对此问题进行自定义?还是有可能认识到pickle

0x60

有些模型可以公开partial_fit()而其他模型则不公开这是有原因的每个模型都是不同的机器学习算法,对于这些算法中的许多算法,只有在没有从头开始重新计算模型的情况下,才能添加元素。

因此,如果您必须逐步拟合模型,请选择具有的增量模型partial_fit()您可以在此文档页面上找到完整列表

或者,您可以构建整体模型。创建一个单独的Classifier()Regression()为您的数据的每一个块。然后,当您需要预测某些事情时,您可以

for classifier in classifiers:
  votes[classifier.predict(X)] += 1
prediction = numpy.argmax(votes)

或者,对于回归者

prediction = numpy.mean([regressor.predict(X) for regressor in regressors] 

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章