如何创建一个汇总重复行的列,然后仅删除 R 中的一个重复项?

Lana Meijinhos

我有一个非常庞大的数据集,我正在寻找最简单(也是最快)的方法来创建一个列,该列对一个特定列的值求和,然后继续只留下一个重复项。

我的数据集如下所示:

data <- data.frame(DATE_INTER = c("2015-05-29", "2013-12-13", "2009-09-08"),
                   DATE_SAIDA = c("2015-06-10", "2013-12-15", "2009-10-20"),
                   GRUPO_AIH = c("09081997", "13122006", "13122006"),
                   DIAS_PERMANENCIA = c(12, 2, 42))

我需要使用“GRUPO_AIH”列来检查重复项。我的最终输出将是这样的:

在此处输入图像描述

我已经尝试过了,但是它花费了太长时间,完成后,我什至无法使用 dplyr 过滤任何 R 停止工作的东西。

data <- data %>%
  group_by(GRUPO_AIH) %>%
  mutate(DIAS_PERMANENCIA2 = sum(DIAS_PERMANENCIA))

有什么建议么?

卢卡尼尔森

这是答案。只是一个观察,在您提供的数据集示例中,您实际上在 GRUPO_AIH 变量中没有任何重复的值,所以我改为GRUPO_AIH = c("09081997", "13122006", "13122006"),

data %>%
  group_by(GRUPO_AIH) %>%
  mutate(DIAS_PERMANENCIA = sum(DIAS_PERMANENCIA)) %>%
  filter(duplicated(GRUPO_AIH) == FALSE)




DATE_INTER DATE_SAIDA GRUPO_AIH DIAS_PERMANENCIA
  <chr>      <chr>      <chr>                <dbl>
1 2015-05-29 2015-06-10 09081997                12
2 2013-12-13 2013-12-15 13122006                44

OBS:我也是一名健康专家,负责处理监控中的数据 kk

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何仅删除满足 R 中另一个条件的重复项?

如何删除在R中具有重复项并满足另一个条件的行?

逐行从两列中选择重复项并在 R 中创建一个新变量

创建一个for循环以删除重复项,并从R中数据框的不同列将其导出为csv

在 R 中创建一个重复但增加的序列

如何创建一个只包含重复行的表,并从主表中删除重复项?

如何创建一个新列,保留 R 中先前字符的非重复字符?

从阵列中仅删除一个重复项

R - 识别并删除重复行的一个实例

在R中使用一个变量创建“重复”行

R:从向量中提取非重复值(对于重复项不保留一个值)

如何在R中的重复项数组中仅保留一个值(最新值)

如何在r中随机保留一个重复行(而不是第一重复行)

R-识别并删除在另一个矩阵中重复的矩阵行

R:删除数据框中重复的行,该数据框中的第二列包含一个值

仅打印重复项中的一个值

r如何根据条件更改多个列(在另一个列中重复)

如何为R中的每个col的所有行重复一个函数

如何基于R中的重复和条件将行合并为一个

R:识别重复组中的第一个和最后一个元素

如何从具有重复项的向量中仅删除一个元素

如何仅使用一个for循环删除数组中的重复项?

从一个没有重复其余行的文件中删除重复项

如何删除每列中的两个重复项之一并将它们合并到 r

从列表中删除重复项:保留顺序和每个元素的最后一个重复项

如何从R中的(9)个重复值创建一个新变量?我需要循环吗?

一种删除列表中仅一个元素的连续重复项的Python方法

Boxplot/Box & Whisker 帮助 ggplot2 (R) 需要删除重复项,同时还要在一个图上绘图

如何从第一个重复项中删除具有相同ID的其余行?