我正在使用WEKA为我的大学做一个项目,我正在分类一个非常大的文本文件(300MB)。但这是一个非常缓慢的过程。
我查看了任务管理器,发现weka仅使用10%的cpu,而总体cpu利用率约为13%。我想增加weka的cpu使用率。我已经将weka的优先级设置为“高”。
有什么想法我该怎么做?
如果您正在训练(训练数据集),则默认情况下,weka使用10倍交叉验证。Weka Explorer或命令行在单线程中完成所有折叠。通过使用GUI Weka KnowledgeFlow,可以分别在线程上执行每个折叠。在您的情况下,这将是最简单的方法。但是,每个折叠都可以分发到其他计算机,因此每个折叠可以在不同的机器上执行。有关折页分布的更多信息,请参见Weka-Parallel。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句