通过公共列合并R中的不均匀数据框并通过NA填充空元素

达芙妮的眼睛

这些是我正在处理的两个数据框的示例。'Claims' 的行数少于 'lastaction' 的行数。

在此处输入图片说明

我的尝试给出了以下错误。

newtable <- merge(claims, lastaction, by = "X", all = TRUE)

[<-.data.frame( tmp , value, value = NA) 中的错误:新列会在现有列之后留下孔洞

newtable <- merge(claims, lastaction, by.x = claims$X, by.y = lastaction$X, all = TRUE)

fix.by(by.x, x) 中的错误:'by' 必须匹配列数

普拉德普

merge功能对我来说很好用。由于两个数据框具有相同的列名X,因此可以使用by.

claims = data.frame(X = c(10,24,30,35,64,104), 
                    TransactionDateTime = c('JUL-15','APR-17','SEP-15','JUL-15','APR-16','SEP-15'))
claims
#     X TransactionDateTime
# 1  10              JUL-15
# 2  24              APR-17
# 3  30              SEP-15
# 4  35              JUL-15
# 5  64              APR-16
# 6 104              SEP-15

lastaction = data.frame(X = c(10,24,30,35,40,57), lastvalue = c(6,1,4,6,6,1), 
                        Approvalmonth = c('15-OCT','17-JAN','16-MAR','15-OCT','15-SEP','17-JUN'), 
                        lastvalue = c(0,1,0,0,0,1)) 
lastaction
#    X lastvalue Approvalmonth lastvalue
# 1 10         6        15-OCT         0
# 2 24         1        17-JAN         1
# 3 30         4        16-MAR         0
# 4 35         6        15-OCT         0
# 5 40         6        15-SEP         0
# 6 57         1        17-JUN         1

merge(claims, lastaction, by = "X", all = TRUE)
#     X TransactionDateTime lastvalue Approvalmonth lastvalue.1
# 1  10              JUL-15         6        15-OCT           0
# 2  24              APR-17         1        17-JAN           1
# 3  30              SEP-15         4        16-MAR           0
# 4  35              JUL-15         6        15-OCT           0
# 5  40                <NA>         6        15-SEP           0
# 6  57                <NA>         1        17-JUN           1
# 7  64              APR-16        NA          <NA>          NA
# 8 104              SEP-15        NA          <NA>          NA

dplyrfull_join还有工程

dplyr::full_join(claims, lastaction, by = 'X')
    X TransactionDateTime lastvalue Approvalmonth lastvalue.y
1  10              JUL-15         6        15-OCT           6
2  24              APR-17         1        17-JAN           1
3  30              SEP-15         4        16-MAR           4
4  35              JUL-15         6        15-OCT           6
5  64              APR-16        NA          <NA>          NA
6 104              SEP-15        NA          <NA>          NA
7  40                <NA>         6        15-SEP           6
8  57                <NA>         1        17-JUN           1

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Python Pandas:合并填充不均匀的数据框

如何用列中的第一个值填充不均匀的熊猫数据框列

将数据框与“不均匀”数据合并

如何折叠行以填充每列行数不均匀的组中的NA?

将XML文件中的不均匀元素放入数据框

按 ID 合并两个不均匀的数据帧并填充缺失值

砌体中的不均匀列

GridBagLayout中的列不均匀

在 R 中创建不均匀序列

按行名称合并不均匀数据框的列表

从字典中返回值的方法合并不均匀的对应元素

通过两个不均匀的循环

重塑熊猫中不均匀的数据框,从锯齿状的宽到高

熊猫从不均匀的嵌套列表中获取数据框

融化列中的不均匀数据,并使用熊猫忽略NaN

将宽数据框分为两个不均匀的列数据框,并将其更改为长格式

R中的数据处理:长度不均匀的子集和排列向量

创建显示共现的整洁数据框:共生网络的三列,使用不均匀字符向量列表中的数据

使用Tidyr将字符串长度不均匀的行拆分为R中的列

在Python中拆分不均匀间隔的列

Python-使用行中不均匀的列

列长度不均匀的文件中读取的熊猫

dplyr 通过 R 中的公共行值合并数据帧

在R中建立不均匀矩阵的数组

将具有不均匀或缺失行的嵌套命名列表转换并展平为R中的单个数据框

通过列中的值合并 Pandas 数据框中的数据

数据间隔不均匀的散点图系列

如何遍历不均匀的数据块

表格布局的列宽不均匀