在数据框中分别计算多个变量，变量名称包含一个序列

劳尔

我有一个巨大的数据框，后面跟随着多个变量名。为简化起见，我创建了一个包含8个变量的示例，后5个变量遵循列名称中的顺序：I5min_thresh.118，I5min_thresh.118.5，I5min_thresh.119，I5min_thresh.119.5，I5min_thresh.120）。

变量名称中的序列只是一个示例，可以有所不同，例如，变量序列名称可以从60到180乘以0.1步（在此示例中从118到120乘以0.5步）。

可重现的数据帧：

df<-data.frame(Event=c("yes","yes","yes","no","no","no","no","no","no"),
           mois=c(0.3,0.2,0.2,0.3,0.3,0.3,0.3,0.3,0.2),
           I_float=c(96.0,100.8,96.0,21.6,10.8,10.8,16.8,8.4,16.8),
           Imax.118=c(95.0,105.0,77.0,15.0,5.0,49.7,53.8,51.2,57.8),
           Imax.118.5=c(97.0,90.0,100.0,16.0,15.0,50.2,54.3,51.7,58.3),
           Imax.119=c(98.0,110.0,78.0,51.4,8.0,50.7,54.8,52.2,58.8),
           Imax.119.5=c(99.8,71.0,80.0,51.9,51.2,51.2,55.3,52.7,59.3),
           Imax.120=c(54.6,71.5,79.0,52.4,51.7,51.7,55.8,53.2,59.8))

数据框的外观如下：

我想为每个Imax计数以下变量，并将其存储在新的数据框中：

如果Event = yes，则I_float> = Imax的次数，作为变量TP。
如果Event = yes，则I_float <Imax的次数，作为变量FN
如果Event = no，则I_float> = Imax的次数，作为变量FP。
如果Event = no，则I_float <Imax的次数，作为变量TN。

结果数据帧应如下所示，其中Yintercept等于Imax变量中包含的序列号：

现在，我仅设法为1个变量计算TP，FN，TN和FP，通过在r代码（Imax.118）中准确指出变量名称来说出变量Imax.118（上一示例的第一行）。我不能使用手动方法，因为在真实数据框中，按照名称顺序包含数百个变量。

任何帮助将不胜感激。

伦尼

使用gather我们可以把我们的数据长，只保留了数字和原来的点Imax列，然后按我们的Yintercept列和行总结其返还金额TRUE为指定的条件TP，FN，TN和FP列。

library(tidyverse)
df %>% 
  gather(Yintercept, val, -Event, -mois, -I_float) %>% 
  mutate(Yintercept = as.numeric(gsub("Imax\\.", "", Yintercept))) %>% 
  group_by(Yintercept) %>% 
  summarise(TP = sum(I_float > val & Event == "yes"),
            FN = sum(I_float < val & Event == "yes"),
            TN = sum(I_float < val & Event == "no"),
            FP = sum(I_float > val & Event == "no"))

  Yintercept    TP    FN    TN    FP
       <dbl> <int> <int> <int> <int>
1       118      2     1     4     2
2       118.     1     2     5     1
3       119      1     2     5     1
4       120.     2     1     6     0
5       120      3     0     6     0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-23

我来说两句

0 条评论

登录后参与评论

上一篇：在路由器视图中相同组件之间的Vue切换不会再次安装/创建

TOP 榜单

文章

在数据框中分别计算多个变量，变量名称包含一个序列

在数据框中分别计算多个变量，变量名称包含一个序列

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID