根据多个条件仅替换列中的某些值

Tajda 发表于 Dev

浪潮

我有一个很大的数据框，其中包含许多列，但相关的列是：ID（这是分配给受试者的编号），时间（进行该受试者测量的时间）和浓度。一个非常简化的示例是：

df <- data.frame( ID=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3),
                  Concentration=c("XXX",0.3,0.7,0.6,"XXX","XXX",0.8,0.3,"XXX","XXX",
                                  "XXX",0.6,0.1,0.1,"XXX"),
                  Time=c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5))

我想根据以下条件仅替换“浓度”列中的“ XXX”值：

当“时间”列中的值小于或等于3时；“ XXX” == 0
当“时间”列中的值大于3时；除非时间> 3的单个主题（ID）出现两个连续的“ XXX”值，否则应将“ XXX”替换为单词“ Missing” ，然后将第一个连续的“ XXX”替换为0.05，将第二个连续的“ XXX”替换为（如果还有更多，则以下所有“ XXX”值）应替换为“缺少”一词。

我已经尝试过mutate_at和replace_na，一些ifelse语句和case_when，但是我似乎无法弄清楚如何正确地做到这一点。任何帮助将不胜感激！

编辑：只是为了展示一些工作：

df[df == "XXX" & df$Time<3] <- as.numeric(0)
df[df == "BLQ" & df$Time>3] <- as.character("Missing")

我设法找到一种简单而又健壮的解决方案来解决问题的前两个部分，而我所坚持的是最后一个部分-当“时间>”后单个主题有两个或多个连续的“ XXX”值时3。我想我应该在ifelse语句和ID或类似内容的索引列表上循环，但是我不知道该怎么做。在这里以某种方式分隔ID非常重要，因为可能将“ XXX”作为一个ID的最终浓度和作为下一个ID的第一个浓度，我不希望将其作为两个连续的“ XXX”值来读取一个ID。

Manuzambo

我使用tidyverse的一些功能解决了该问题，并且还向您的示例添加了其他一些记录。

rm(list = ls(all=TRUE))

require(tidyverse)

df <- data.frame( ID=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,3,3),
                  Concentration=c("XXX",0.3,0.7,0.6,"XXX","XXX",0.8,0.3,"XXX","XXX",
                                  "XXX",0.6,0.1,0.1,"XXX",0.2,"XXX","XXX",1),
                  Time=c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,6,7,8,9))

df <- tibble(df) %>% 
  mutate(Concentration = as.character(Concentration),
         Concentration_Original = Concentration) %>% 
  mutate(Concentration = ifelse(Concentration == 'XXX' & Time <= 3, "0", Concentration)) %>%
  group_by(ID) %>% 
  mutate(Concentration = ifelse(Concentration == 'XXX' & Concentration == lead(Concentration),
                                  "0.05", ifelse(Concentration == 'XXX',
                                                 "Missing", Concentration))) %>% 
  replace_na(list(Concentration = "Missing")) %>% ungroup()

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：创建加载消息，这些消息将根据闪亮的应用程序中情节的加载时间而改变

TOP 榜单

文章

根据多个条件仅替换列中的某些值

根据多个条件仅替换列中的某些值

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用