R中有％in％的问题子集

威尔考克斯

由于某种原因，我在使用%in%运算符删除单个数据框中没有两个单独时间点值的主题时遇到了一个问题。我的数据框为长格式，并且具有以下类型：

Subject Group Timepoint word.RT
399     1        t1     979
399     1        t1     818
399     1        t1     761
399     1        t1    1066
399     1        t2     855
399     1        t2    1338
399     1        t2     834
399     1        t2    1018

数据位于简单的.csv文件中。

由于这项研究仍在进行中，并且缺少数据，因此某些受试者只有t1数据，而其他受试者只有t2数据。为了将仅具有t1和t2数据的主题子集化，我一直在使用（并在过去成功使用过）以下代码：

dat <- dat[dat$Subject[dat$Timepoint=="t1"] %in% 
           dat$Subject[dat$Timepoint=="t2"],]

dat <- dat[dat$Subject[dat$Timepoint=="t2"] %in% 
           dat$Subject[dat$Timepoint=="t1"],]

奇怪的是，这对某些主题有效，但不适用于其他主题，我什至有一个实例可以在一个主题上使用，然后我关闭R，重新加载所有内容，再试一次，它将不适用于它以前曾为之工作过的一些主题。我确保将每个主题的时间点编码为t1或t2，并且没有奇怪的格式化方式，就像某个地方的随机空间一样。人们在与%in%操作员调和时会遇到这样的错误吗？

我会鼓励你学习和使用两种dplyr或data.table为这种事情。两种方法都可以很好地工作，但最好选择一个入门并熟悉它。两者都有他们的信徒。两者都会使您的生活变得无比轻松。我在这里显示两个选项。在这种情况下，也许dplyr看起来稍微简单一些，但是对于其他操作，data.table会更加简洁：

library(dplyr)
dat %>%
  group_by(Subject) %>%
  filter(all(c('t1','t2') %in% Timepoint))

library(data.table)
setDT(dat)[, both := all(c('t1','t2') %in% Timepoint), by = Subject][both == TRUE]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-25

我来说两句

0 条评论

登录后参与评论

上一篇：python迭代字典值（如果一个键具有一个或多个值）

TOP 榜单

文章

R中有％in％的问题子集

R中有％in％的问题子集

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接