如何确定每行具有最大值的N列？

伊格纳西奥

我的数据看起来像这样：

set.seed(122217)
df <- data.frame(ID = paste0("id",1:100), A = rnorm(100), E = rnorm(100), I = rnorm(100), O = rnorm(100), U = rnorm(100))

我想产生一个包含100行和1 + 3列的新数据框。每行应对应于df中的每个ID，第一列为，ID其他列为第一，第二，第三。

我可以用一些非常丑陋的代码来做到这一点：

library(data.table)
library(dplyr)
# transpose
t_df <- transpose(df[,2:6])
# get row and colnames in order
colnames(t_df) <- df[,1]
rownames(t_df) <- colnames(df[,2:6])
id_largest <-function(data, col){
  values <- data[,col]
  names(values) <- row.names(data)
  values <- sort(values, decreasing = T)
  ranking <- names(values)
  out <- data.frame( id= colnames(data)[col], First=ranking[1], Second=ranking[2], Third=ranking[3])
  return(out)
}

ranking <- purrr::map(1:ncol(t_df), id_largest, data=t_df) %>% rbindlist()

这段代码产生了我想要的：

> head(ranking)
id First Second Third
1: id1     A      E     I
2: id2     U      O     I
3: id3     A      E     I
4: id4     E      U     I
5: id5     I      A     U
6: id6     I      A     U

但是不是很优雅。有没有更干净的方法可以做到这一点？

贾普

使用data.table以下解决方案：

library(data.table)

melt(setDT(df), id = 1)[order(-value)
                        ][, variable[1:3], ID
                          ][, dcast(.SD, ID ~ rowid(ID, prefix = 'p'))]

这使：

        ID p1 p2 p3
  1: id001  A  E  I
  2: id002  U  O  I
  3: id003  A  E  I
  4: id004  E  U  I
  5: id005  I  A  U
....
 95: id095  O  A  U
 96: id096  U  A  I
 97: id097  A  U  O
 98: id098  U  A  O
 99: id099  I  E  U
100: id100  E  I  U

与相同的逻辑tidyverse：

library(dplyr)
library(tidyr)

df %>% 
  gather(key, value, -1) %>% 
  group_by(ID) %>% 
  arrange(ID, -value) %>% 
  slice(1:3) %>% 
  select(-value) %>% 
  mutate(rn = paste0('p', row_number())) %>% 
  spread(rn, key)

使用的数据：

set.seed(122217)
df <- data.frame(ID = sprintf("id%03d",1:100), A = rnorm(100), E = rnorm(100), I = rnorm(100), O = rnorm(100), U = rnorm(100))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-27

我来说两句

0 条评论

登录后参与评论

上一篇：是否可以将自定义视图添加到您无法访问项目文件的现有MVC站点？

查找每行具有最大值的列索引

如何识别每行最大值的列

如何计算每行的最大值，并返回最大值的列和具有相应列名称的另一列？

查找每行具有最大值的列名

如何获得具有列最大值的行？

如何计算pyspark中每行某些列的最大值

如何使用 dplyr 获取每行最大值的列

Pandas：Groupby，连接一列并确定具有最大值的行

每行n个最大值

如何选择每行（不是所有列）的最大值并变异2列，它们是R中的最大值和名称？

每行的最大值

如何删除具有最小值和最大值的空值的列

如何确定SQLite中多列的最大值

如何获取在python中具有最大值的列的列？

如何使用 MySQL 在第三列中对具有最大值的 2 列进行分组？

找到每行（熊猫）具有第二最大值的列名

R：具有最大值的列和行索引

TSQL：获取具有最大值的列的行

选择具有最大值保存不同列的行

获取具有列最大值的行

返回具有一列最大值的行

SQL-获取具有最大值的列的索引

使用groupby创建具有最大值的新列

删除具有特定列最大值的行

检索一列具有最大值的行

具有零的列中连续序列的最大值

添加具有组最大值的列

在geopandas的列中选择具有最大值的行

如何在SQL中找到具有多个最大值的组的最大值？

TOP 榜单

文章

如何确定每行具有最大值的N列？

如何确定每行具有最大值的N列？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用