如果值在不同的列中具有相同的组合，则删除行

arteteco 发表于 Dev

44

Arteteco

我有一个相互面对的410个DNA序列，以获得相似性。

现在，要修剪数据库，我应该摆脱两列中具有相同值的行，因为当然每个值都将是双精度值。

为了使自己清楚，我有类似

tribble(
  ~seq01, ~seq02, ~ similarity,
  "a",   "b", 100.000,
  "b",   "a", 100.000,
  "c",   "d", 99.000,
  "d",   "c", 99.000,
)

比较ab和ba是同一回事，所以我想摆脱double值

我要结束的是

tribble(
  ~seq01, ~seq02, ~ similarity,
  "a",   "b", 100.000,
  "c",   "d", 99.000
)

我不确定如何进行，我想到的所有方式都有些古怪。我检查了其他答案，但并不真正令我满意。

任何输入将不胜感激（但整洁的输入将更加感激！）

罗纳克·沙

我们可以使用pmin和pmax对值进行排序，然后使用distinct选择唯一的行。

library(dplyr)

df %>%
  mutate(col1 = pmin(seq01, seq02),
         col2 = pmax(seq01, seq02), .before = 1) %>%
  distinct(col1, col2, similarity)

#  col1  col2  similarity
#  <chr> <chr>      <dbl>
#1 a     b            100
#2 c     d             99

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：通过simple-salesforce查询Python中的ID列表

相关文章

熊猫在不同的列中删除具有相同数据组合的行

如果 2 列在不同行上具有相同的值，如何删除 Excel 行？

如果上面的行具有相同的值，则删除 Pandas 数据帧的两列中的值

从R中的df中删除具有相同列A值但具有不同列B值的行（反之亦然）

删除r中另一列中具有相同ID但值不同的行

从pyspark数据框中删除具有相同值但在不同列中的重复行

删除所有列中具有相同值的行

删除所有列中具有相同值的行

如果所有列中的值相同，则删除行

在不同的列中查找具有相同值的行对

删除Dataframe列中具有相同值的行

选择不同列中具有相同值的行或 null 。有多行具有相同的 id

如果在不同的列（AWK）上具有相同的值，则合并连续的行的值

更新表在不同的行中具有两个具有相同值的不同列

Pandas - 如果另一行具有相同的值但列被切换，则删除行

获取在“位置”列中具有相同不同值组合的 ID 数量

当行具有不同顺序的相同值时删除行

如何组合某些列中具有相同值的值

根据其他行中具有相同值的不同行的文本值的组合，创建新的熊猫行

如果不同行中的两列具有相同的值，则分组？

删除具有相同值但名称不同的列

如何组合两列（Python）中具有相同值的行？

如果具有相同的值，如何从数组中删除索引

如何在熊猫数据框中的列中组合具有不同值的行

具有相同值但在不同列中的Mysql行&在一行中显示它们

MySQL 查询一列中具有相同值而另一列中具有不同值的行

选择在一列中具有相同值而在另一列中具有不同值的行

如果另一列在SQL Server中相同，则获取具有最小列值的行

从 Dataframe 中删除行上方或下方在特定列中具有相同值的行

TOP 榜单

文章

热门标签

归档