如果值在不同的列中具有相同的组合,则删除行

Arteteco

我有一个相互面对的410个DNA序列,以获得相似性。

现在,要修剪数据库,我应该摆脱两列中具有相同值的行,因为当然每个值都将是双精度值。

为了使自己清楚,我有类似

tribble(
  ~seq01, ~seq02, ~ similarity,
  "a",   "b", 100.000,
  "b",   "a", 100.000,
  "c",   "d", 99.000,
  "d",   "c", 99.000,
)

比较ab和ba是同一回事,所以我想摆脱double值

我要结束的是

tribble(
  ~seq01, ~seq02, ~ similarity,
  "a",   "b", 100.000,
  "c",   "d", 99.000
)

我不确定如何进行,我想到的所有方式都有些古怪。我检查了其他答案,但并不真正令我满意。

任何输入将不胜感激(但整洁的输入将更加感激!)

罗纳克·沙

我们可以使用pminpmax对值进行排序,然后使用distinct选择唯一的行。

library(dplyr)

df %>%
  mutate(col1 = pmin(seq01, seq02),
         col2 = pmax(seq01, seq02), .before = 1) %>%
  distinct(col1, col2, similarity)

#  col1  col2  similarity
#  <chr> <chr>      <dbl>
#1 a     b            100
#2 c     d             99  

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫在不同的列中删除具有相同数据组合的行

如果 2 列在不同行上具有相同的值,如何删除 Excel 行?

如果上面的行具有相同的值,则删除 Pandas 数据帧的两列中的值

从R中的df中删除具有相同列A值但具有不同列B值的行(反之亦然)

删除r中另一列中具有相同ID但值不同的行

从pyspark数据框中删除具有相同值但在不同列中的重复行

删除所有列中具有相同值的行

删除所有列中具有相同值的行

如果所有列中的值相同,则删除行

在不同的列中查找具有相同值的行对

删除Dataframe列中具有相同值的行

选择不同列中具有相同值的行或 null 。有多行具有相同的 id

如果在不同的列(AWK)上具有相同的值,则合并连续的行的值

更新表在不同的行中具有两个具有相同值的不同列

Pandas - 如果另一行具有相同的值但列被切换,则删除行

获取在“位置”列中具有相同不同值组合的 ID 数量

当行具有不同顺序的相同值时删除行

如何组合某些列中具有相同值的值

根据其他行中具有相同值的不同行的文本值的组合,创建新的熊猫行

如果不同行中的两列具有相同的值,则分组?

删除具有相同值但名称不同的列

如何组合两列(Python)中具有相同值的行?

如果具有相同的值,如何从数组中删除索引

如何在熊猫数据框中的列中组合具有不同值的行

具有相同值但在不同列中的Mysql行&在一行中显示它们

MySQL 查询一列中具有相同值而另一列中具有不同值的行

选择在一列中具有相同值而在另一列中具有不同值的行

如果另一列在SQL Server中相同,则获取具有最小列值的行

从 Dataframe 中删除行上方或下方在特定列中具有相同值的行