如何使用 R 中的均值和标准差替换缺失值?

什鲁蒂亚米

我有一个数据集

X   Y   Z 
22  44  66
NA  67  89
42  45  98
NA  98  77
NA  63  33
65  54  78
89  67  90
87  78  83
NA  55  56
61  11  50
67  45  90
NA  90  43
90  43  76

现在,我想将 X 列中的 NA 值替换为“mean+StandardDeviation”和“mean-StandardDevaitaion”,而且太随机了。有人可以为此建议代码吗?

桑尼

您可以生成值并随机分配值。一个例子:

x <- c(22,NA,42,NA,NA,65,89,87,NA,61,67,NA,90)
x_mean <- mean(x, na.rm = T)
x_sd <- sd(x, na.rm = T)

values <- c(x_mean + x_sd, x_mean - x_sd)

set.seed(42)
n <- sum(is.na(x))

x[is.na(x)] <- sample(values, n, TRUE)
x
[1] 22.00000 89.52298 42.00000 89.52298 41.22702 65.00000 89.00000 87.00000 41.22702 61.00000
[11] 67.00000 89.52298 90.00000

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在R data.table中,如何使用训练集的均值和标准差标准化测试集

仅使用均值和标准差信息在 R 中绘制密度图

如何使用均值和标准差从pyspark中的多个列中删除离群值

插值数据集的均值和标准差 (R)

如何在R中排除均值和标准差计算的月份

R dplyr 使用 group_by 汇总平均值和标准差

R中的函数:如何在同一函数中返回均值,中位数,标准差

如何从列表中获取均值、中值和标准差

如何根据R中的值向标准差的向量中添加随机值

如何用R标记正态曲线上的平均值和三个标准差

查找行的均值和标准差,直到R中的组的下一个NA值

如何使用 CSV 文件绘制均值和标准差?

如何找到R中的累积方差或标准差

R:每个受试者的均值,方差和标准差列

在 R 中的图表上绘制均值和标准差的问题

计算R中不同组之间的均值和标准差

将某些列重新调整为 R 中的特定均值和标准差

在 R 中使用 data.table() 和 dplyr() 按月对多级数据进行子集化和汇总(总和、均值和标准差)

如何获得此类数据的计数、均值和标准差?

给定PySpark DataFrame如何计算均值和标准差?

如何计算分组表的均值和标准差?

Python:如何赢得均值和标准差?

如何计算多个分组变量的均值和标准差?

使用data.table的行均值和标准差

使用scipy.stats的分布均值和标准差

使用numpy的多个数组的均值和标准差

使用选定的均值和标准差缩放向量

使用循环查找均值和标准差

如何通过将R替换为均值来处理R中的缺失值?