使用unique（data.table）或distinct（dplyr）和部分gsub删除行

gmanlearnscoding

我有一个数据集，可以说DT1。DT1有2列，城市和地方。我将DT1与另一个数据集（DT2）匹配以填充缺少的City值。但正如您所看到的，有些地方在不同的城市，名字相同。我要删除此地方，并将其余地方与DT2匹配。这是我的DT1。

DT1 <- data.table::data.table(city = c("XXX", "XXX", "YYY","ZZZ"),
 places= c("apple","orange","apple","pineapple"))

#> City     BirthPlace
#> XXX      apple
#> XXX      orange
#> YYY      apple
#> ZZZ      pineapple

当我使用唯一或不相同时，它保留1个苹果，这在DT2中引起问题，因为即使我的苹果位置属于YYY，它也会将XXX粘贴到DT2中的city列中。

这是DT2的一个例子

DT2 <- data.table::data.table(zipcode = c("00001","00002","00003","00004"),
                  birthplace= c("apple","orange","pineapple","grapes")

#> ZipCode  BirthPlace
#> 00001      apple
#> 00002      orange
#> 00003      pineapple
#> 00004      grapes

如您所见，我在DT2中有一个苹果商店。我不知道它的位置，是在城市XXX还是在YYY。这就是为什么我需要删除DT1中的所有苹果行，但是唯一或独特功能使我无法看到它们始终保持第一行的原因。

这是我想要实现的

DT3 <- data.table::data.table(city = c("XXX","ZZZ"),
                  birthplace= c("orange","grapes"),
                  zipcode = c("00002","00004")
#>  City BirthPlace ZipCode
#>   XXX    orange  00002
#>   ZZZ    grapes  00004

除此之外，某些出生地的值还包括标点符号，例如apple st。我试图将其分开，让苹果一个人呆着，gsub("^(st.)*$","",dt2$birthplace)但对这个家伙没有任何建议吗？

阿克伦

一个选项 data.table

library(data.table)
DT1[, if(.N == 1) .SD, places][DT2, on = .(places = birthplace), nomatch = 0]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-24

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

使用unique（data.table）或distinct（dplyr）和部分gsub删除行

使用unique（data.table）或distinct（dplyr）和部分gsub删除行

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序