我正在对恢复站点中的本机/非本机封面进行分析。数据由多边形组织,然后横断,然后固定。我不在乎某个图钉是否具有1个本地物种或3个本地物种-我只是在乎是否具有任何本地物种。现在,原始数据如下所示:
最后,我希望我的数据看起来像这样的格式:
问题是,现在我的代码正在对本地,非本地等的每个条目进行计数。并对每个样条求和。但是,我希望它对具有本机/非本机/等的引脚总数进行求和。不管有多少。因此,例如,如果引脚5具有3个本机,那么我仍然只希望在最终表中将其计为1个本机。有人可以帮忙吗?下面的代码虽然不能共享数据:
mynewtable <- data %>%
count(polygon_id, transect, native_non_native) %>%
spread(native_non_native, n)
似乎您要依靠的内容有些重复。您可以简单地获取一组唯一的数据,您将可以依靠它们获得期望的结果。
> df <- data.frame(polygon_id = replicate(10,'OW-M7'),
transect = replicate(10,1),
pin_number = c(1,1,1,2,3,4,5,6,7,8),
native_non_native =c(replicate(5,'Native'),replicate(5,'NoNative'))
)
> df
polygon_id transect pin_number native_non_native
1 OW-M7 1 1 Native
2 OW-M7 1 1 Native
3 OW-M7 1 1 Native
4 OW-M7 1 2 Native
5 OW-M7 1 3 Native
6 OW-M7 1 4 NoNative
7 OW-M7 1 5 NoNative
8 OW-M7 1 6 NoNative
9 OW-M7 1 7 NoNative
> mynewtable <- df %>% select(polygon_id, transect, pin_number, native_non_native) %>% distinct() %>% count(polygon_id, transect, native_non_native) %>% spread(native_non_native, n)
> mynewtable
# A tibble: 1 x 4
polygon_id transect Native NoNative
<fct> <dbl> <int> <int>
1 OW-M7 1 3 5
当然,如果这些是数据框中仅有的列,那么您可以简单地忽略选择步骤,而只需使用
> mynewtable <- distinct(df) %>% count(polygon_id, transect, native_non_native) %>% spread(native_non_native, n)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句