如何根据dplyr中的条件进行过滤？

极大主义

ID val1 val2
a  1  6
a  1  6
a  3  2
a  4  2
a  5  5
b  2  3
b  2  2
c  3  2
c  4  4
c  5  5
c  6  6
c  5  2
c  2  3

使用

dat <-df %>%
  group_by(ID) %>%
  summarise(corr=cor(val1, val2))

这将为每个组计算val1和val2的相关性。但是我只想对出现3次以上的ID进行过滤。基本上，我想计算每个ID的出现次数（例如a = 5，b = 2，c = 6），并且仅计算出现次数超过3的那些ID的相关性（在这种情况下，b将为被忽略，因为它发生了两次）。

这是大型数据库的一部分。

如何使用dplyr？

mdgbeck

对于小于2的情况，这将为您提供不包含任何内容的输出。

dat <- df %>%
  group_by(ID) %>%
  mutate(N = n()) %>%
  filter(N >= 3) %>%
  summarise(corr = cor(val1, val2))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-4

我来说两句

0 条评论

登录后参与评论

上一篇：Azure DocumentDB受限制的请求

根据某些条件在dplyr中进行过滤

如何根据相关条件过滤dplyr

如何根据多种条件进行过滤：ReactJS

如何根据dplyr中的值过滤列？

如何使用 R 中的 dplyr 根据跨越多列的条件过滤数据框

如何根据JPA中的组过滤条件？

如何根据数组中的元素进行过滤？

如何根据 Microsoft SQL 中的参数按条件子集进行过滤？

如何使用 row_number (dplyr) 进行多条件过滤？

根据列中的条件使用 dplyr 进行切片

根据熊猫中的多个条件对行进行分组和过滤

根据Javascript中数组内对象数组的条件进行过滤

根据可选过滤条件在Excel中对行进行计数

根据另一列中满足的条件进行过滤

根据向量中的特定条件进行过滤

如何根据列中的条件进行计算？

如何根据python中的条件进行连接

使用dplyr根据多种条件过滤行

如何使用参数作为 R 中 dplyr 的过滤条件？

如何根据条件过滤数组

如何根据 dplyr 中的多个条件选择列

如何根据ID进行过滤

如何根据选择进行过滤？

如何根据相关两列中的条件过滤记录

如何根据Ruby中的条件哈希过滤对象数组？

如何根据窗口和pyspark中的条件过滤行？

如何根据条件过滤掉 SQL 查询中的值

根据过滤条件进行语言构造

使用filter_if根据条件进行过滤

TOP 榜单

文章

如何根据dplyr中的条件进行过滤？

如何根据dplyr中的条件进行过滤？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局