计算非收费算法,以找到大数据帧中变量wrt的最小值和最大值的一个因素?

马泰奥

我有一个非常大的数据框,其中某些值与某个因素相关联,如下所示:

value      user
12         USER1
4          USER5
6          USER3
50         USER1
2          USER2
1          USER1
8          USER5
9          USER3
55         USER1
15         USER2

我想找出每个用户的值的最大值和最小值。我尝试了for循环,在其中创建了一个temp变量,并在其中找到了用户列表中的max和min。但是,数据库的大小很大(100Mb),并且要花费很长时间(30分钟)。有更聪明的方法吗?谢谢。

博维尔上校

如果df是data.frame“大”数据的原始格式,建议使用data.tablepackage:

library(data.table)

dt = data.table(df)
setkey(dt, user)

dt[,list(min(value), max(value)),by=user]
    user V1 V2
1: USER1  1 55
2: USER5  4  8
3: USER3  6  9
4: USER2  2 15

编辑:很好的例子,在使用each来自plyr

> library(plyr)
> dt[,as.list(each(min,max)(value)),by=user]
    user min max
1: USER1   1  55
2: USER5   4   8
3: USER3   6   9
4: USER2   2  15

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从包含以下因素的数据帧子集中获取最小值和最大值

如何在r的数据框中找到数字wrt的最大值和最小值?

在一个日期之后使用另一个变量的值达到该日期的最大值/最小值的日期之后分割数据帧

从ArrayList中删除一个最大值和最小值

Python数据帧计算元素列表的最小值和最大值

计算数据帧的最小值和最大值时出现类型错误

用java写两种方法的最小值和最大值,以找到最大值和链表中的最小值,但输入列表是一个整数数组

如何创建一个函数来计算和返回平均值、最大值和最小值?

数组的总和,而忽略一个最小值和一个最大值

我在 Python 中编写了一个代码来从 5 个元素的数组中找到 4 个元素的最大值和最小值

如何从向量中删除一个最大值和一个最小值?

如何在数据框中的变量中找到一组中最大值和最小值的差异

SwiftUI如何给滑块一个最小值和最大值,并在Text中显示其值?

如何基于另一个数据框的最小值和最大值创建列

计算数据框中列的最大值、平均值和最小值

使用Group BY通过一个MySQL查询获取最小值和最大值

是否有一个函数返回最小值和最大值之间的整数?

如何在同一个表中设置最小值和最大值?

在最大值和最小值之间找到一个数字,并在该范围内生成一个随机整数

如何从 R 中跨多个数据帧的公共列中找到最大值/最小值

如何找到数据帧或矩阵的最小值/最大值的位置(行/列)(R问题)

计算由数据帧 R 中的另一个变量分组的最大连续重复非 NA 值

创建一个新变量,它是python中另一个变量的每周最小值/最大值

在 R 中的 ddply 中获取数据帧中子组列的最大值和最小值

在数据结构中找到最大值最小值和最大键值

熊猫找到当地的最大值和最小值

找到最小值+最大值和关联的列

如何找到最大值和最小值

在第一个数据框给定的2个日期之间找到第二个数据框的最小值和最大值