如何对R中相同的两列具有不同值的数据框进行子集

用户1471980

我有这个数据框:

dput(df)

structure(list(Metrics = c("db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)", 
"db2.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)", 
"db2.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)", 
"db2.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)", 
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)"
), Date = c(1416257563.98707, 1416257563.98707, 1416257563.98707, 
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707, 
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707, 
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707, 
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707, 
1416257563.98707), Value = c(0, 0.02, 0.01, 0, 0.01, 0.01, 0.07, 
0, 2.02, 0, 0, 9.32, 0.02, 9.27, 0, 12.72, 12.72, 12.72, 0.08, 
12.72), Type1 = c("type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database", "type=rac_database", 
"type=rac_database", "type=rac_database")), .Names = c("Metrics", 
"Date", "Value", "Type1"), class = "data.frame", row.names = c(10092L, 
10097L, 10103L, 10104L, 10107L, 10108L, 10111L, 10112L, 10114L, 
10115L, 10116L, 10117L, 10118L, 10120L, 10121L, 10188L, 10189L, 
10190L, 10192L, 10216L))

这是更大数据帧的子集。如您所见,对于相同的“指标”和“日期”,存在多个不同的值。我只想为相同的数据和指标类型选择最大值。因此,对于相同的日期和指标,我应该只有一个值,该值应该是最高点。任何想法,我怎么能子集这个df?

例如,对于度量标准:db1.Tablespace_Space_Used _(%)和日期:1416257564

在我的df中,我应该有一个条目:

 db1.Tablespace_Space_Used_(%) 1416257564 12.72 type=rac_database
托皮格

与此处给出的答案相同。查找一列的最大值(按组),然后将值插入R中的另一数据帧

假设您的数据帧被调用 df

df_1 <- aggregate(Value ~ Metrics + Date + Type1, df, max)
df_1
#edit: removed 'cbind'

输出

                        Metrics       Date             Type1 Value
1 db1.Tablespace_Space_Used_(%) 1416257564 type=rac_database 12.72
2 db2.Tablespace_Space_Used_(%) 1416257564 type=rac_database  9.32

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何通过熊猫或spark数据框删除所有行中具有相同值的列?

如何基于具有相同列但顺序不同的另一个数据框对列进行重新排序

合并两个不同列中具有匹配值的数据框-Pandas

如何通过合并R中不同数据框中具有相同名称的列来创建新数据框?

SQL-如何选择两列中具有相同值的不同行

R:如何添加两个具有不同列的数据框

在R中具有不同列长度的多个数据框中更改列中的值

合并具有不同dtype的两列数据框的值

熊猫数据框,删除某些列中具有相同值的两行之间的行

从pyspark数据框中删除具有相同值但在不同列中的重复行

Python连接两个数据框以查找相同的行值,在相应的行中具有不同的值

如何在R数据框中聚合具有两个不同功能的两个不同列

如何处理具有相同ID但Python列中的值不同的数据帧中的记录

使用R中具有相同值的外部数据框对数据框进行排序

在具有相同ID pyspark数据框的另一列中显示不同的值

如何在R中合并具有几个相同ID的两个数据框

如何使用R根据数据框中单个列的最小值对特定列中的行进行子集

您如何子集一个在R中具有多个重复值的数据框

如何在R的另一列中仅对具有多个不同值的行进行子集化?

获取两列中具有相同值的行数据

如何通过从具有给定字符串且值小于 X 的列中删除所有行来对数据框进行子集化?

当不同表中的两列具有相同名称时,如何使用SqlDataReader 读取数据?

如何保留数据框中所有列中具有相同值的所有行?

按列值对数据框中具有相同索引的值进行排序

R glm - 如何从具有相同数据格式和值的两个不同数据集中预测相同的系数

R-如何组合具有相同列名但顺序不同的两个数据框

Python,Pandas 数据框,合并具有相同两列值的数据框的行并聚合行中的数据

Groupby 熊猫数据框具有相同值的两列

如何根据R中两列不匹配的值对数据框进行子集化?