如何删除唯一条目并在R中保留重复项

沉睡的
ID     Cat1  Cat2    Cat3   Cat4
A0001   358 11.25   37428   0
A0001   279 14.6875 38605   0
A0013   367 5.125   40152   1
A0014   337 16.3125 38624   0
A0020   367 8.875   37797   0
A0020   339 9.625   39324   0

我需要学习如何在保留重复项或三重复项的同时删除文件中的唯一行的帮助。例如,输出应如下所示:

ID     Cat1  Cat2    Cat3   Cat4
A0001   358 11.25   37428   0
A0001   279 14.6875 38605   0
A0020   367 8.875   37797   0
A0020   339 9.625   39324   0

如果您能给我建议如何解决这个问题,不胜感激。

感谢大家的建议。我想计算重复度量(通过唯一ID)在不同类别(即Cat2,Cat 3)中的值差异。将不胜感激任何建议。

研究

基础R中的另一个选项 duplicated

dx[dx$ID %in% dx$ID[duplicated(dx$ID)],]

#      ID Cat1    Cat2  Cat3 Cat4
# 1 A0001  358 11.2500 37428    0
# 2 A0001  279 14.6875 38605    0
# 5 A0020  367  8.8750 37797    0
# 6 A0020  339  9.6250 39324    0

使用重复的data.table

使用duplicatedfromLast获得的版本:

library(data.table)
setkey(setDT(dx),ID) # or with data.table 1.9.5+: setDT(dx,key="ID")
dx[duplicated(dx) |duplicated(dx,fromLast=T)]

#       ID Cat1    Cat2  Cat3 Cat4
# 1: A0001  358 11.2500 37428    0
# 2: A0001  279 14.6875 38605    0
# 3: A0020  367  8.8750 37797    0
# 4: A0020  339  9.6250 39324    0

这也可以应用于基数R,但是我更喜欢data.table作为语法糖。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

汇总具有相同ID的行,并仅保留R中的唯一条目

如何在列中列出唯一条目并在下一列中列出其重复的相应时间?

如何显示表中的唯一条目?

如何计算R中一天中最多的唯一条目数?

循环唯一条目

如何删除重复项并在表中保留一行-SQL

如何删除重复项并在表格中保留一行

如何在两列之间删除重复项,但在各列中保留唯一值?

我如何创建唯一条目列表,同时还要消除同级条目?

从sqlite获取所有唯一条目

计数dinstinct(),但仅包含唯一条目

从列表中查找最长的唯一条目

CSV操作唯一条目

计算空白Excel之间的唯一条目

如何从向量中删除唯一值并保留重复项

R数据框过滤器并计算唯一条目

如果R数据中满足条件,则获取唯一条目

如何计算唯一条目而不是总和值(环境数据集)

如何在哈希表中的数组中创建唯一条目

SQL-如何检索与非唯一条目相对应的唯一整体的计数?

对于列表中的每个唯一条目,请在R?中添加一个日期范围。

php while 循环列出唯一条目并计算每个条目的总数

如何解析文本文件中的字符串模式并计算唯一条目?

按时间分组,然后仅当列表中存在唯一条目时才对唯一条目进行计数

在组中保留第一条记录并在 SQL 中用 Null/0 填充休息?

删除重复项,保留最后一个条目-优化

在一定数量的唯一条目后拆分文件

Powershell 获取数组第一列的唯一条目

连接数据帧时不创建重复的行,同时将一列下的唯一条目串联