我想从sklearn.cluster.KMeans类中了解参数max_iter。
根据文档:
max_iter : int, default: 300
Maximum number of iterations of the k-means algorithm for a single run.
但是我认为如果我有100个对象,则代码必须运行100次,如果我有10.000个对象,则代码必须运行10.000次才能对每个对象进行分类。另一方面,对所有对象运行几次是没有意义的。
我的误解是什么,如何解释这个参数?
在这里看看:
https://www.naftaliharris.com/blog/visualizing-k-means-clustering/
每次单击更新质心,都会执行一个新的迭代。这是有道理的,因为当质心移动时,到这些质心的距离也会更改,并且某些点可能会更改聚类。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句