如何在数据框的列中嵌套表？

用户2165379

我读到可以将数据帧存储在带有嵌套的数据帧列中：https : //tidyr.tidyverse.org/reference/nest.html

是否也可以将表存储在数据框的列中？

原因是我想用 Caret 计算数据帧的每个子组的 Kappa。尽管 caret::confusionMatrix(t) 需要一个表作为输入。

在下面的示例代码中，如果我一次计算完整数据帧的 Kappa，这可以正常工作：

library(tidyverse)
library(caret)

  # generate some sample data:
  n <- 100L
  x1 <- rnorm(n, 1.0, 2.0)
  x2 <- rnorm(n, -1.0, 0.5)
  y  <- rbinom(n, 1L, plogis(1 * x1 + 1 * x2))
  my_factor <- rep( c('A','B','C','D'), 25 )   
  
  df <- cbind(x1, x2, y, my_factor)
  
  # fit a model and make predictions:
  mod <- glm(y ~ x1 + x2, "binomial")
  probs <- predict(mod, type = "response")
  
  # confusion matrix
  probs_round <- round(probs)
  
  t <- table(factor(probs_round, c(1,0)), factor(y, c(1,0)))
  ccm <- caret::confusionMatrix(t)
  
  # extract Kappa:
  ccm$overall[2]

> Kappa
> 0.5232

尽管如果我尝试将group_by每个因子作为子组生成 Kappa（参见下面的代码），它不会成功。我想我需要以t某种方式嵌套，df尽管我不知道如何：

  # extract Kappa for every subgroup with same factor (NOT WORKING CODE):

  df <- cbind(df, probs_round)
  df <- as.data.frame(df)
  
  output <- df %>%
    dplyr::group_by(my_factor) %>% 
    dplyr::mutate(t = table(factor(probs_round, c(1,0)), factor(y, c(1,0)))) %>%
    summarise(caret::confusionMatrix(t))

Expected output:

>my_factor Kappa
>1 A       0.51
>2 B       0.52
>3 C       0.53
>4 D       0.54

这是正确的，这可能吗？（由于样本数据的随机性，Kappa 的确切值会有所不同）

非常感谢！

克提乌

您可以跳过mutate()给您带来麻烦的中间环节：

library(dplyr)
library(caret)

df %>%
    group_by(my_factor) %>% 
    summarize(t = confusionMatrix(table(factor(probs_round, c(1,0)),
                                        factor(y, c(1,0))))$overall[2])

# A tibble: 4 x 2
  my_factor     t
  <chr>     <dbl>
1 A         0.270
2 B         0.513
3 C         0.839
4 D         0.555

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-31

我来说两句

0 条评论

登录后参与评论

上一篇：如何在使用 ffmpeg/fluidsynth 从 MIDI 文件转换为 mp3 时更改音频的比特率

如何使用嵌套字典在数据框中映射列？

如何在数据框中按列分组并在循环中创建数据透视表

在数据框中嵌套几组列

如何在数据框中添加日期列

如何在数据框中添加列？

如何在数据框中强制指定列类型？

如何在数据框列中添加逗号

如何在数据框的列中对元组进行排序

如何在数据框中的列之间匹配值

如何在数据框中按名称删除列

如何在数据框中划分两列

如何在数据框中拆分此类列？

如何在数据框中添加新的计算列？

如何在数据框的列中迭代列表项

如何在数据框的列中查找元素的编号

如何在数据表中“取消列出”列

如何在数据透视表中查找列的位置

如何在数据框中添加一列，说明每行来自哪个工作表名称？蟒蛇

在数据框列中填充嵌套数组

如何在数据表中的搜索框行下方有一个 div？

如何在数据表中显示引导选择组合框？

如何在数据表的搜索框中输入值

Vuetify如何在数据表中打开和关闭对话框

如何在数据框中添加基于数据长度的值作为字符串的列

如何在数据框中添加新列并填充列？

如何在数据框的列表类型列2中搜索/比较列1的整数？

如何在数据框中的列中连接列表格式的项目

如何在数据框中的一列中实现 groupby？

如何在数据框中创建映射到R中的列表的列？

TOP 榜单

文章

如何在数据框的列中嵌套表？

如何在数据框的列中嵌套表？

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID