通过不同的数据框循环回归

Dima 发表于 Dev

迪马

目标是对不同的训练数据帧进行多重 logit 回归，然后评估各自测试数据集的性能。

首先，我们从以下位置创建多个 (5) 随机采样的数据帧df：

for(i in 1:5) {
nr <- paste("random_df", i, sep = "_")
assign(nr, random_df[sample(nrow(df)),])
}

然后，我们为分离训练集和测试集创建指标：

train <- 1:(length(df$y)*0.8)
test  <- !(1:nrow(df) %in% train)

现在我们想在每个训练数据帧上循环一个 logit 回归。这是第一个问题，因为我们只能将输出创建为矩阵或列表。我们或者创建随机样本的列表、数据框或矩阵：

lr_list <- list(random_df_1,random_df_2,random_df_3,random_df_4,random_df_5)

然后，我们在列表中的所有数据帧上循环 logit 回归：

for(i in 1:5) {
  index <- paste("lr_train", i, sep = "_")
  assign(index, lapply(lr_list, function(x) {glm(y ~ x1 + x2, data=x, 
  subset=train, family=binomial)}))
}

这里lapply创建了sapply每个估计结果的列表和矩阵。

目标是获得glm对象形式的输出，以便使用每个训练 glm进行预测，从而能够评估不同测试/训练数据星座的模型性能：

lr_test_1 <- predict(lr_train_1, random_df_1[test, ], type="response")

非常感谢任何帮助。

膝上型

我很确定你误解了lapply. 它循环输入并创建一个对象列表，这些对象属于您使用的函数输出的典型类。

如果我正确阅读了您的代码，这部分

for(i in 1:5) {
  index <- paste("lr_train", i, sep = "_")
  assign(index, lapply(lr_list, function(x) {glm(y ~ x1 + x2, data=x, 
  subset=train, family=binomial)}))
}

本质上是在同一事物上循环两次，因此创建了五个相同的列表。

相反，只需使用：

lr_train <- lapply(lr_list, function(x) {glm(y ~ x1 + x2, data=x, 
      subset=train, family=binomial)})

然后mapply你predict遍历 glm 对象列表。

lr_test <- mapply(function(x, y) predict(x, y[test, ], type = "response"), lr_train, lr_list)

请注意，由于缺少工作数据示例，这是未经测试的。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-12

我来说两句

0 条评论

登录后参与评论

上一篇：从图像的右中心使用 jquery 的图像幻灯片

通过不同的数据框回归

如何使用两个数据框通过 for 循环运行线性回归

通过循环写入数据框

使用Master数据框使用rbind聚合回归循环

在 R 回归中循环不同的变量和数据集

通过循环合并两个不同的数据框（python）

滚动回归数据框

For 循环创建熊猫数据框 - 不同的数据框名称？

通过for循环绘制数据框列

通过 for 循环向数据框添加列

如何通过for循环填充熊猫数据框？

通过 Pandas 数据框的高效循环

通过循环传递不同的数据类型

将sapply重复（循环）回归结果输出到数据框

循环遍历数据框列来做简单的线性回归？

在pandas python中随机排列数据框的行会带来不同的回归结果吗？

在for循环中用不同的dtype填充数据框

在for循环中创建名称不同的数据框-Python？

语法：具有不同子集的循环回归

通过列表和数组列表的数据框进行计算循环

如何通过for循环构建和填充pandas数据框？

通过 for 循环创建多个命名数据框

通过循环从数据框列获得唯一值

For 循环通过 Pandas 数据框获取纬度和经度

如何通过for循环连接csv数据框列表

通过SPSS回归为Python映射循环

通过组合不同的组创建新的数据框

通过对熊猫的不同列应用条件来过滤数据框

TOP 榜单

文章

通过不同的数据框循环回归

通过不同的数据框循环回归

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

SQL Server中的非确定性数据类型

Swift 2.1-对单个单元格使用UITableView

如何避免每次重新编译所有文件？

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

应用发明者仅从列表中选择一个随机项一次

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

HttpClient中的角度变化检测

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何了解DFT结果

Camunda-根据分配的组过滤任务列表

错误：找不到存根。请确保已调用spring-cloud-contract：convert

为什么此后台线程中未处理的异常不会终止我的进程？

构建类似于Jarvis的本地语言应用程序

使用分隔符将成对相邻的数组元素相互连接

您如何通过 Nativescript 中的 Fetch 发出发布请求？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

使用React / Javascript在Wordpress API中通过ID获取选择的多个帖子/页面

使用 text() 獲取特定文本節點的 XPath