合并数据框中的行和列

Ryan 发表于 Dev

瑞安

诚然，我是R的新手，但是我设法获取了一个大数据集并提取了想要的数据，并使用plyr将其放入了数据框。我在尝试合并（并计数）重复的行和列时遇到困难。

例如，我有...

> df
   X x.APPLES x.BANANAS x.PEARS x.ORANGES x.GRAPES x.KIWIS x.APPLES.1 x.ORANGES.1
1  A   APPLES                                                                    
2  B   APPLES                                                                    
3  C   APPLES                                                                    
4  D            BANANAS                                                          
5  E            BANANAS                                                          
6  F            BANANAS                                                          
7  G            BANANAS                                                          
8  H                      PEARS   ORANGES   GRAPES                               
9  I                      PEARS   ORANGES   GRAPES                               
10 C                      PEARS   ORANGES   GRAPES                               
11 C                      PEARS   ORANGES   GRAPES                               
12 R                      PEARS   ORANGES   GRAPES                               
13 A                                                 KIWIS                       
14 B                                                           APPLES            
15 Y                                                           APPLES            
16 A                                                                      ORANGES
17 J                                                                      ORANGES

而且我要...

       X   x.APPLES   x.BANANAS   x.PEARS   x.ORANGES   x.GRAPES   x.KIWIS COUNT
1      A APPLES (1)                       ORANGES (1)            KIWIS (1)     3
2      B APPLES (2)                                                            2
3      C APPLES (1)             PEARS (1) ORANGES (2) GRAPES (2)               3
4      D            BANANAS (1)                                                1
5      E            BANANAS (1)                                                1
6      F            BANANAS (1)                                                1
7      G            BANANAS (1)                                                1
8      H                        PEARS (1) ORANGES (1) GRAPES (1)               1
9      I                        PEARS (1) ORANGES (1) GRAPES (1)               1
10     R                        PEARS (1) ORANGES (1) GRAPES (1)               1
11     Y APPLES (1)                                                            1
12     J                                  ORANGES (1)                          1
13 COUNT          5           4        4            7          5         1    NA

这是我的实际代码：

library("jsonlite")
library("plyr")
anom <- fromJSON("https://api.fda.gov/drug/event.json?search=_exists_:seriousnesscongenitalanomali&limit=25")
reactions <- anom$results$patient$reaction
drugs <- llply(anom$results$patient$drug, function(x) x$medicinalproduct)
l <- mapply(c, reactions, drugs, SIMPLIFY=FALSE)
df <- ldply (l, data.frame)

代恩

使用OP数据进行编辑：

我下载了您的实际数据，并将数据转换为两个两列的data.frame，您可以使用下面的示例将其转换为所需的输出。

require(jsonlite)
anom <- fromJSON("https://api.fda.gov/drug/event.json?search=_exists_:seriousnesscongenitalanomali&limit=5")

## Extract the reactions and drugs as character vectors
reactions <- lapply(anom$results$patient$reaction, 
                    function(x) as.character(unlist(x)))
drugs <- lapply(anom$results$patient$drug, 
                function(x) as.character(unlist(x$medicinalproduct)))

## Use expand.grid to make subset data.frames with all drug/reaction
## combinations for every patient
l <- mapply(expand.grid, reactions, drugs, SIMPLIFY = FALSE)

## Collapse all the subset data.frames into one
two_col <- do.call(rbind, l)

原始示例：

如果我们假设您有一个两列的data.frame开始：

require(reshape2)
fruits <- c("Bannana", "Apple", "Orange", "Grape", "Kiwi")
example <- data.frame(ID = sample(LETTERS[1:6], 25, replace = TRUE),
                      Fruit = sample(fruits, 25, replace = TRUE))

# > example
#    ID   Fruit
# 1   F    Kiwi
# 2   A   Apple
# 3   F    Kiwi
# ...

dcast(example, ID~Fruit, length, value.var = "Fruit")

more_complex <- function(x) {
  x_len <- length(x)
  x <- paste0(unique(x), " (", x_len, ")")
  x
}

dcast(example, ID~Fruit, more_complex, value.var = "Fruit")

# > dcast(example, ID~Fruit, more_complex, value.var = "Fruit")
#   ID     Apple     Bannana     Grape     Kiwi     Orange
# 1  A Apple (2) Bannana (2) Grape (2)      (0) Orange (2)
# 2  B Apple (1)         (0)       (0) Kiwi (1) Orange (2)
# 3  C       (0) Bannana (2)       (0) Kiwi (1) Orange (1)
# 4  D       (0) Bannana (1)       (0)      (0) Orange (1)
# 5  E       (0)         (0) Grape (1) Kiwi (1)        (0)
# 6  F       (0) Bannana (1) Grape (1) Kiwi (2) Orange (1)

another_option <- function(x) {
  x_len <- length(x)
  if (x_len == 0) return(NA_character_)
  x <- paste0(unique(x), " (", x_len, ")")
  x
}

dcast(example, ID~Fruit, another_option, value.var = "Fruit")

# > dcast(example, ID~Fruit, another_option, value.var = "Fruit")
#   ID     Apple     Bannana     Grape     Kiwi     Orange
# 1  A Apple (2) Bannana (2) Grape (2)     <NA> Orange (2)
# 2  B Apple (1)        <NA>      <NA> Kiwi (1) Orange (2)
# 3  C      <NA> Bannana (2)      <NA> Kiwi (1) Orange (1)
# 4  D      <NA> Bannana (1)      <NA>     <NA> Orange (1)
# 5  E      <NA>        <NA> Grape (1) Kiwi (1)       <NA>
# 6  F      <NA> Bannana (1) Grape (1) Kiwi (2) Orange (1)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-23

我来说两句

0 条评论

登录后参与评论

合并数据框中的行和列

合并数据框中的行和列

使用OP数据进行编辑：

原始示例：

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接