从一个数据集中提取一个列,并使用R中的第三个数据集中的列创建另一个数据集

googleplex101

所以我有这两个数据集:

    ID      DOB         ID2   count
1   4083    2007-10-01  3625    5
2   4408    2008-07-01  3603    2
3   4514    2007-07-01  3077    3
4   4396    2008-05-01  3413    5
5   4222    2003-12-01  3341    1
6   4291    2000-07-01  3201    5
7   4581    2005-07-01  3836    1
8   4487    2007-01-01  3264    5
9   4916    2009-10-01  3825    1
10  4277    2000-04-01  3381    2

ID       DOB       score1   score2  score3  score4  score5  score6
4291    2000-07-01  2       5       2       2       1       2
4323    2000-07-01  3       3       1       4       2       5
4408    2008-07-01  4       2       5       5       3       5
4222    2003-12-01  2       1       3       2       3       3
4581    2005-07-01  5       1       5       2       3       1
4005    2003-06-01  1       4       2       4       5       3
4718    2009-02-01  2       3       1       5       5       5
4396    2008-05-01  3       5       2       2       2       5
4924    2008-02-01  5       5       4       5       5       4
4083    2007-10-01  4       5       1       3       3       4
4099    2000-05-01  4       3       1       2       1       2
4277    2000-04-01  2       2       1       3       1       1
4487    2007-01-01  2       5       2       4       3       5
4514    2007-07-01  1       3       4       3       1       5
4003    2005-07-01  3       3       4       1       1       3
4366    2008-12-01  4       4       4       4       3       4
4790    2009-07-01  1       3       1       3       1       4
4643    2002-03-01  3       2       3       3       4       3
4475    2009-05-01  1       4       3       3       3       3
4916    2009-10-01  5       1       3       1       2       2

在数据集2中,有来自数据集1的ID和Dob,以及我不感兴趣的主题ID的其他行。我想做的是提取两个数据集中存在的ID,并从中创建“ ID2”列的数据集数据集1和数据集2中的其他列。

ID       DOB         ID2    score1  score2  score3  score4  score5  score6
4394    2004-11-01  3625    2       2       4       2       2       3
4181    2002-04-01  3603    3       1       3       2       2       5
4942    2001-08-01  3077    3       3       5       3       1       5
4765    2003-05-01  3413    1       5       5       2       3       2
4517    2003-03-01  3341    1       2       1       4       1       5
4905    2002-12-01  3201    5       2       4       1       1       5
4636    2004-07-01  3836    3       1       1       4       4       4
4179    2004-08-01  3264    5       2       5       5       4       2
4448    2007-11-01  3825    2       3       5       4       2       4
4218    2006-04-01  3381    1       5       3       4       5       3 

我认为合并功能在这里发挥了作用,但是对于我一生来说,我似乎无法使其正常工作,因此,感谢您能提供的任何帮助。

ath

这能满足您的需求吗?

 merge(df1, df2, by.x=c("ID","DOB"))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用SAS中的另一个数据集从数据集中提取

R:与数据集中的两个变量相关,另一个数据集中的第三个变量被识别

使用一个数据帧列的元素选择另一个数据帧中的值以使用 Tidyverse 创建第三个数据帧

根据另一个数据集中的列值在一个数据框中创建列

根据另一个数据集的列值从数据集中提取两列的值

用另一个数据集中的数据填写一个数据集中的多列

如何在R中另一个数据集的列中选择一个数据集中的一些行?

根据条件从 R 中的另一个数据集中添加一个数据集中的列值 - 不同的长度

根据来自另一个数据集中的列的条件创建新列

检查数据集的行是否也在另一个数据集中并提取索引

使用For循环在R中的列表中的每个数据集中创建一个列

如何检查一个数据集中的单元格是否存在于另一个数据集中的变量/列中?

R:使用另一个数据框创建一个新列

用另一个数据集中的列中的值填充空值

根据另一个数据集中的值更改另一个数据集中的值

如何将列值从一个数据框中提取到另一个?

使用另一个数据集中的值搜索和更新Spark Dataset列

R:根据另一个数据集中的几个变量填写一个新列

R根据另一个条件从一个数据集中生成多个Excel文件

将长数据除以R中另一个数据集中的值

根据另一个数据集中的值选择一个数据集中的变量

如何从r中具有相同列的另一个数据帧中提取一个数据帧的值?

如何基于匹配另一个数据集中的唯一值来从一个数据集中删除行?

在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

如何将矩阵乘以另一个数据集中的列?

计算数据集中的行与R中另一个数据集的所有行之间的差

使用基数R根据另一个数据集的索引替换数据集中的值

如何将数据从一个数据集中添加到 R 中的另一个?

如何使用鼠标或R中的另一个包从多个变量中提取多个推定值到单个数据集中?