如何基于参考向量完成长格式数据帧的缺失值

骗子

我有以下数据框:

library(dplyr)
library(tibble)


df <- tibble(
  source = c("a", "b", "b"),
  day = c("D1", "D2", "D3"),
  score = c(10, 5, 3) ) 


df

看起来像这样:

> df
# A tibble: 3 x 3
  source day   score
  <chr>  <chr> <dbl>
1 a      D1       10
2 b      D2        5
3 b      D3        3

现在的价值观sourceday不完整。的完整列表source,并day存储为载体:

complete_source <- c("a", "b","c")
complete_day <- c("D1", "D2" ,"D3", "D4")

我要做的是基于complete_source完成数据帧,complete_day用零(0)填充值。

所需的结果是(手工制作):

 source day   score
 a      D1       10
 a      D2        0
 a      D3        0
 a      D4        0
 b      D2        5
 b      D3        3
 ... etc ...
 c      D1        0
 c      D2        0
 c      D3        0
 c      D4        0
 ...etc

我该如何实现?

阿克伦

我们可以用 complete

library(tidyr)
library(dplyr)
complete(df, source = complete_source, day = complete_day, fill = list(score = 0))
# A tibble: 12 x 3
#   source day   score
#   <chr>  <chr> <dbl>
# 1 a      D1       10
# 2 a      D2        0
# 3 a      D3        0
# 4 a      D4        0
# 5 b      D1        0
# 6 b      D2        5
# 7 b      D3        3
# 8 b      D4        0
# 9 c      D1        0
#10 c      D2        0
#11 c      D3        0
#12 c      D4        0

crossing使用vectors做一个并加入

crossing(source = complete_source, day = complete_day) %>% 
        left_join(df) %>%
        mutate(score = replace_na(score, 0))

在中base R,可以使用expand.grid/merge

transform(merge(expand.grid(source = complete_source, 
      day = complete_day), df, all.x = TRUE), 
      score = replace(score, is.na(score), 0))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

来自分类Dev

如何基于向量作为源来完成数据帧的列和行中的缺失值

来自分类Dev

将数据帧分成长度不等的向量列表

来自分类Dev

如何创建具有基于groupby值的熊猫数据帧向量

来自分类Dev

如何基于列名的向量过滤R中的数据帧?

来自分类Dev

使用向量作为数据帧的参考,如何将函数应用于向量内的所有数据帧?

来自分类Dev

如何基于向量隔离数据帧中的值,然后使用R将其乘以同一数据帧中的另一列?

来自分类Dev

如何用Julia数据帧中的缺失值替换伪值?

来自分类Dev

将数据帧中的每四行系列折叠为一个向量,覆盖缺失值

来自分类Dev

如何完成时间序列中的缺失值

来自分类Dev

基于至少5个连续值的向量序列的子集数据帧

来自分类Dev

如何处理熊猫数据帧中特定长度序列中的缺失值?

来自分类Dev

如何挑选在数据帧中的行与非缺失值的至少一个变量?

来自分类Dev

如何通过比较两个数据帧来计算缺失值

来自分类Dev

如何基于R中相同数据帧中的值扩展数据帧

来自分类Dev

如何基于数据帧的长度作为索引值在数据帧中创建额外的列

来自分类Dev

模拟数据并向数据帧中随机添加缺失值

来自分类Dev

基于表值的数据帧插值

来自分类Dev

如何基于向量对数据帧进行子集化,然后在dplyr中进行分组

来自分类Dev

如何使用dplyr管道基于向量对数据帧的行进行排序

来自分类Dev

如何基于已知字符向量对数据帧下序列中的字符进行计数

来自分类Python

填写大熊猫数据帧的缺失值

来自分类Dev

计算数据帧Spark中缺失值的数量

来自分类Dev

如何基于R中的长格式数据帧创建具有不同列长的Markdown表?

来自分类Dev

如何选择数据帧“ df1”的连续行,其值与向量“ A”中的值匹配

来自分类Dev

如何使用成长和过滤器功能根据ID和缺失值在Google表格中创建动态范围?

来自分类Dev

如何基于列值拆分数据帧,对字符串值进行排序或分组依据?

来自分类Dev

如何从多个向量创建数据帧?

来自分类Dev

如何用缺失的前后值的平均值填充向量中的缺失值

来自分类Dev

如何将两个向量与缺失值合并?

TOP 榜单

热门标签

归档