按包含另一个字符串的字符串匹配值

爱德华多·波利

我有两个数据框。第一个看起来像这样：

month     Joanne K. Rowling   Samuel L. Jackson
2000/01   1                   0
2000/02   1                   1
2000/03   0                   1
2000/04   0                   0
2000/05   0                   1
2000/06   1                   0

test_1<-data.frame("Month"=c("2000/01","2000/02","2000/03","2000/04","2000/05","2000/06"), “乔安妮·K·罗琳”=c(1,1,0,0,0,1),“塞缪尔·杰克逊”=c(0,1,1,0,1,0))

另一个看起来像这样

Name            Score
Samuel Jackson  67
Joanne Rowling  52

test_2<-data.frame("Name"=c("Samuel Jackson","Joanne Rowling"),"Score"=c(67,52))

我想将它们组合起来以获得以下数据框

month     Joanne K. Rowling   Samuel L. Jackson
2000/01   52                   0
2000/02   52                   67
2000/03   0                    67
2000/04   0                    0
2000/05   0                    67
2000/06   52                   0

其中值 1 替换为 test_2 中的分数。test_1 中的列名可能与 table_2 中的值略有不同，因此不应修复匹配项。我找到了一种方法来做到这一点：

for(i in 1:nrow(test_2)) {
  for(k in 1:ncol(test_1){
    for(l in 1:nrow(test_1)){
      if(grepl(test_2[i,6],as.data.frame(colnames(test_1))[k,1])) {
        if(test_1[l,k]==1){
          test_1[l,k]<-test_2[i,5]
        }
      }
    }
  }
}

但它非常低效，因为我必须将其应用于数据框列表。请尝试编写一种尽可能少循环的有效方法

罗纳克·沙阿

我认为grepl不会直接在这里工作，因为'Joanne Rowling'与'Joanne K. Rowling'. 您可以使用stringdist::stringdistmatrix来获取匹配项，然后将相应的值相乘。

mat <- stringdist::stringdistmatrix(names(test_1)[-1], test_2$Name)
test_1[-1] <- sweep(test_1[-1], 2, test_2$Score[max.col(-mat)], `*`)
test_1

#    Month Joanne K. Rowling Samuel L. Jackson
#1 2000/01                52                 0
#2 2000/02                52                67
#3 2000/03                 0                67
#4 2000/04                 0                 0
#5 2000/05                 0                67
#6 2000/06                52                 0

要将其应用于多个数据帧，您可以执行以下操作：

lapply(test_1_list, function(x) {
  mat <- stringdist::stringdistmatrix(names(x)[-1], test_2$Name)
  x[-1] <- sweep(x[-1], 2, test2$Score[max.col(-mat)], `*`)
  x
}) -> result
result

test_1_list数据框列表在哪里。

数据

test_1<-data.frame("Month"=c("2000/01","2000/02","2000/03","2000/04","2000/05","2000/06"),
                   "Joanne K. Rowling"=c(1,1,0,0,0,1),
                   "Samuel L. Jackson"=c(0,1,1,0,1,0), check.names = FALSE)
test_2<-data.frame("Name"=c("Samuel Jackson","Joanne Rowling"),"Score"=c(67,52))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-22

我来说两句

0 条评论

登录后参与评论

上一篇：如何将具有从 HTTP 请求收到的天数的 Json 解析为 Scala 和 Play 框架中的列表

按包含另一个字符串的字符串匹配值

按包含另一个字符串的字符串匹配值

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序