根据其他列和行有条件地计算一列中不同数量的项目

为阿尔菲

我对 R 比较陌生，所以如果这太离谱了，我深表歉意。但我有一个看起来像这样的数据集：

#simplified input - actual data has ~20K observations, 
#V1 is a categorical variable with 2 options, V3 is a categorical variable with 23 options

df <- tribble(
      ~V1, ~V2, ~V3,
      "A", "a", "Z",
      "A", "a", "Y",
      "A", "b", "X",
      "A", "b", "Z",
      "B", "c", "Z",
      "B", "a", "Z",
      "B", "a", "Y",
      "A", "d", "X",
      "A", "e", "X",
      "A", "f", "X",
      "A", "g", "X",
      "B", "g", "X",
      "B", "h", "X",
      "A", "i", "X",
    )

我正在尝试根据 V1 和 V3 的组合计算 V2 的不同值。在这个示例数据中，“a”可以在 A 和 B 中找到，并且可以归类为 Z 或 Y。所以我设想的输出看起来像这样，其中数字是 V2 的不同计数：

所需的输出：

df <- tribble(
      ~V1, ~Z, ~Y, ~X,
      "A_only", 1, 0, 5,
      "B_only", 1, 0, 1,
      "Both_A_and_B", 1, 1, 1
    )

老实说，我完全不知道如何做到这一点，所以任何想法都将不胜感激。

阿努希拉万

更新

问题解决了！

library(dplyr)
library(tidyr)

df %>%
  group_by(V1, V2, V3) %>%
  add_count() %>%
  pivot_wider(names_from = V3, values_from = n) %>%
  group_by(V2) %>%
  mutate(V1 = ifelse(length(V2) > 1, "Both_A_and_B", 
                     ifelse(length(V2) == 1 & V1 == "A", "A_only", 
                            "B_only"))) %>%
  distinct() %>%
  group_by(V1) %>%
  summarise(across(Z:X, ~ sum(.x, na.rm = TRUE)))


# A tibble: 3 x 4
  V1               Z     Y     X
  <chr>        <int> <int> <int>
1 A_only           1     0     5
2 B_only           1     0     1
3 Both_A_and_B     1     1     1

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-24

我来说两句

0 条评论

登录后参与评论

上一篇：在python中打印列表中小于最后一个数字的所有数字

熊猫：根据其他列的值有条件地替换值

Python：根据其他两列中的值有条件地创建新列

根据其他列和行有条件地计算一列中不同数量的项目

根据其他列和行有条件地计算一列中不同数量的项目

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用