样本数据
date coins
2013-10-01 NA
2013-10-01 NA
2013-10-01 NA
2013-11-01 10
2013-11-01 NA
2013-11-01 20
2013-11-01 30
2013-11-01 40
2013-12-30 NA
2013-12-30 22
2013-12-30 24
2013-12-30 25
我想做的事?
我想计算硬币列的均值和中位数,而忽略缺失值。
到目前为止我做了什么?
by_date <- group_by(df, date)
by_date %>% summarise_each_(funs(mean(., na.rm = TRUE), median(., na.rm=TRUE)), names(by_date)[2])
问题summarise_each_返回的结果显示日期为2013-10-01的NaN。这是否意味着该函数不会忽略缺失值?
这里的问题是2013-10-01的所有值都是NA
,所以不可能有平均值。在NaN
为R试图告诉你这一点。
如果您不想在摘要中显示2013-10-01,则一种选择是NA
像这样预先删除值:
by_date<-group_by(df[!is.na(df$coins),],date)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句