这段代码:
Group <- rep(c("A", "B", "C"), each = 3)
Days <- c(21,21,19,18,21,21,11,21,19)
State <- c("OK", "NOK", "OK", "OK", "NOK", "OK", "OK", "OK", "NOK")
data <- data.frame(Group = Group, Days = Days, State = State)
创建此数据框:
> data
Group Days State
1 A 21 OK
2 A 21 NOK
3 A 19 OK
4 B 18 OK
5 B 21 OK
6 B 21 OK
7 C 11 NOK
8 C 21 OK
9 C 19 NOK
我经常使用group_by
和summarizes
的dplyr
做得到参数组(如A,B,C)的。但是我想不出一种简单的方法来获得每个组的OK和NOK(例如NOK百分比)的困扰。我期望的结果是:
> result
Group %NOK
1 A 33.3
2 B 0
3 C 66.6
在进一步的步骤中,我希望计算带有其他条件的比例。例如:计算NOK的数量,其中每个组的天数> 20。我真正直接的解决方案是:
data %>% group_by(Group) %>% nrow(filter(Days < 20, State == "NOK")) / n() * 100
但是,如果您能给我一个解决方案,那实际上是有效的;)
我们可以用 summarise
data %>%
group_by(Group) %>%
summarise(NOKPer = round(100*sum(State=="NOK")/n(),2))
# Group NOKPer
# (chr) (dbl)
# 1 A 33.33
# 2 B 0.00
# 3 C 66.67
对于第二种情况
data %>%
group_by(Group) %>%
summarise(NOKPer = round(100*sum(State=="NOK" & Days >20)/n(), 2))
使用以下方法可以轻松解决 base R
prop.table(table(data[-2]),1)
第二个条件
prop.table(table(subset(data, Days>20, select=c("Group", "State"))),1)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句