重塑具有不同诊断数量的患者数据集

简·布雷德克

我是一个初学者，面临着一项艰巨的任务，而我使用搜索功能发现的所有典型的从长到宽的重塑工具并没有真正为我完成这项工作。如果有人可以帮助我，我会很高兴。

我尝试实现以下目标：

我有一个患者数据，其中每个患者都有唯一的患者编号，但是多次住院会导致每人出现多个病例。我想处理这些情况。问题是，我有每种情况的所有诊断，但不是每个人都有相同的诊断次数，而且我不知道如何在每次已有诊断后告诉R创建新的诊断（和诊断日期）变量。非常感谢您的帮助！

所以，我有一个庞大的数据集，看起来像这样：

        Patient Case Diagnosis DateOfDiagnosis
1      John Doe    1         A      2010-10-10
2      John Doe    1         B      2010-10-10
3      John Doe    1         C      2010-10-10
4 Peter Griffin    2         D      2010-10-11
5 Peter Griffin    2         E      2010-10-11
6 Homer Simpson    3         F      2010-10-12
7 Homer Simpson    4         G      2010-10-13

我需要逐个案例，并且需要所有诊断信息和它们在单独变量中的日期。这没有问题，但是病例或诊断没有模式，因此一些患者只有一个病例，其他5个，而某些病例有1个，另外5个具有相应日期的诊断。所以我需要的是这样的：

        Patient Case Diag1 DateOfDiag1 Diag2 DateOfDiag2 Diag3 DateOfDiag3 ....
1      John Doe    1   A   2010-10-10    B   2010-10-10    C   2010-10-10
2      Peter Grif  2   D   2010-10-11    E   2010-10-11    NA        NA 
3      Homer Simp  3   F   2010-10-12    NA     NA         NA        NA
4      Homer Simp  4   G   2010-10-13    NA     NA         NA        NA

我的示例代码是：

Patient <- c('John Doe','John Doe','John Doe', 'Peter Griffin','Peter Griffin', 'Homer Simpson', 'Homer Simpson')
Case <- c(1,1,1,2,2,3,4)
Diagnosis <- c('A','B','C','D','E','F','G')
DateOfDiagnosis <- as.Date(c('2010-10-10','2010-10-10','2010-10-10','2010-10-11','2010-10-11','2010-10-12','2010-10-13')) 


df<-data.frame(Patient, Case, Diagnosis, DateOfDiagnosis)

非常感谢您的帮助！亲切的问候，扬

罗纳克·沙

pivot_wider创建唯一列后，可以使用。

library(dplyr)
library(tidyr)

df %>%
  group_by(Patient, Case) %>%
  mutate(row = row_number()) %>%
  pivot_wider(values_from =  c(Diagnosis, DateOfDiagnosis), names_from = row)

#   Patient        Case Diagnosis_1 Diagnosis_2 Diagnosis_3 DateOfDiagnosis_1 DateOfDiagnosis_2 DateOfDiagnosis_3
#  <fct>         <dbl> <fct>       <fct>       <fct>       <date>            <date>            <date>           
#1 John Doe          1 A           B           C           2010-10-10        2010-10-10        2010-10-10       
#2 Peter Griffin     2 D           E           NA          2010-10-11        2010-10-11        NA               
#3 Homer Simpson     3 F           NA          NA          2010-10-12        NA                NA               
#4 Homer Simpson     4 G           NA          NA          2010-10-13        NA                NA

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-22

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

重塑具有不同诊断数量的患者数据集

重塑具有不同诊断数量的患者数据集

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成