创建带有变量的折叠,指示 R 中的观察

卢卡斯·海伦

我正在使用 R 来分析一些数据,我需要创建折叠以进行交叉验证。一个观察结果由几行组成,所以我不能简单地使用(例如)CreateFolds 函数。我有一个变量指示哪一行属于哪个主题,所以我想我需要用它来创建折叠。

我怎样才能做到这一点?

例子:

indicator    var1    var2    var3    y
1            2       2       3       10
1            2       3       3       10
2            2       1       1       4
2            1       2       2       4

指示符表明它来自同一主题。

F. 私人

如果你有一个data.frame并且你想做一个 K 交叉验证,你可以做

library(dplyr)    
mutate(df, fold = sample(rep_len(1:K, n_distinct(indicator)))[indicator]) 

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

根据 R 中的滞后观察值创建变量

为 R 中的每组观察创建新变量

从R中的数据框中获取具有多个单个观察值的组级观察值

R中类别变量(id)的每个首次观察的虚拟变量

R中的配对观察

r中的观察计数

如何基于数据帧中的观察顺序添加变量-R

表示 R 中重复观察指数的分类变量

R填充变量以用于数据帧中的特定观察

根据R中的矩阵值创建观察列表

R - 折叠观察并创建新列

在 R 中没有看到观察的最大次数

在sas中创建虚拟变量以指示首次出现观察结果

如果R中的read.csv步骤中的变量具有NA,则删除观察值

根据 R 中的下一个观察创建变量

如果所有组中都出现变量观察,则过滤R中的小标题

R-使用带有for循环的其他变量在数据框中创建变量

R中的“分组”因子观察

R 在第一次出现后用纵向数据中的观察值填充所有观察值

在R?中对分类变量的连续观察中添加计数器

带有 IF 语句的 R 中的新变量

R:如何在数据框中创建一个新列,从基数上计算观察值对变量具有相同值的次数

根据R列中包含相同内容的观察结果,应编写什么代码来创建新变量?

在 R 中的函数中相对引用观察

数据框 R 中的观察数和变量数不相等

根据 R 中 2 个变量的条件按组计算观察值

R 中是否存在将连续变量分类为每组相等数量的观察值的函数?

在 r 中创建带有日期的列?

有没有办法使用 R 中的汇总函数来计算重复观察?