是否可以将数据帧限制为特定行,然后更改其中一列中的某些值?
假设我计算GROWTH
为as (SIZE_t+1 - SIZE_t)/SIZE_t
,现在可以看到存在一些奇怪的值GROWTH
(例如1000),原因是相应SIZE
变量的值损坏。现在,我想查找并替换的损坏值SIZE
。
如果输入:
data <- mutate(filter(data, lead(GROWTH)==1000), SIZE = 2600)
那么只有损坏的行会存储在其中data
,而我的数据帧的其余部分都会丢失。
我想做的是将左侧的“数据”过滤到损坏值的相应行,然后对不正确的变量进行突变(在右侧):
filter(data, lead(GROWTH)==1000) <- mutate(filter(data, lead(GROWTH)==1000), SIZE = 2600)
但这似乎不起作用。有没有办法使用dplyr处理此问题?提前谢谢了
您可以使用ifelse
带有mutate
功能的语句。假设您有一个数据帧,在第3行的SIZE中有一些损坏的值,导致第4行的GROWTH值很大,并且您想在第3行替换SIZE,在0.3
这里用一些值(我选择与您的不同)与我的价值观保持一致)。该GROWTH > 1000
条件可以相应地替换。
data
SIZE GROWTH
1 -1.49578498 NA
2 -0.38731784 -0.7410605
3 0.00010000 -1.0002582
4 0.53842217 5383.2216758
5 -0.65813674 -2.2223433
6 0.29830698 -1.4532599
7 0.04712019 -0.8420413
8 -0.07312482 -2.5518788
9 1.64310713 -23.4698959
10 1.44927727 -0.1179654
library(dplyr)
data %>% mutate(SIZE = ifelse(lead(GROWTH > 1000, default = F), 0.3, SIZE))
SIZE GROWTH
1 -1.49578498 NA
2 -0.38731784 -0.7410605
3 0.30000000 -1.0002582
4 0.53842217 5383.2216758
5 -0.65813674 -2.2223433
6 0.29830698 -1.4532599
7 0.04712019 -0.8420413
8 -0.07312482 -2.5518788
9 1.64310713 -23.4698959
10 1.44927727 -0.1179654
资料:
structure(list(SIZE = c(-1.49578498093657, -0.387317841955887,
1e-04, 0.538422167582116, -0.658136741561064, 0.298306980856383,
0.0471201873908915, -0.0731248216938637, 1.64310713116132, 1.44927727104653
), GROWTH = c(NA, -0.741060482026387, -1.00025818588551, 5383.22167582116,
-2.22234332311492, -1.45325988053609, -0.842041284935343, -2.55187883883499,
-23.4698958999199, -0.117965442690154)), class = "data.frame", .Names = c("SIZE",
"GROWTH"), row.names = c(NA, -10L))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句