我正在使用 R 来分析一些数据,我需要创建折叠以进行交叉验证。一个观察结果由几行组成,所以我不能简单地使用(例如)CreateFolds 函数。我有一个变量指示哪一行属于哪个主题,所以我想我需要用它来创建折叠。
我怎样才能做到这一点?
例子:
indicator var1 var2 var3 y
1 2 2 3 10
1 2 3 3 10
2 2 1 1 4
2 1 2 2 4
指示符表明它来自同一主题。
如果你有一个data.frame
并且你想做一个 K 交叉验证,你可以做
library(dplyr)
mutate(df, fold = sample(rep_len(1:K, n_distinct(indicator)))[indicator])
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句