计算非收费算法，以找到大数据帧中变量wrt的最小值和最大值的一个因素？

Matteo 发表于 Dev

马泰奥

我有一个非常大的数据框，其中某些值与某个因素相关联，如下所示：

value      user
12         USER1
4          USER5
6          USER3
50         USER1
2          USER2
1          USER1
8          USER5
9          USER3
55         USER1
15         USER2

我想找出每个用户的值的最大值和最小值。我尝试了for循环，在其中创建了一个temp变量，并在其中找到了用户列表中的max和min。但是，数据库的大小很大（100Mb），并且要花费很长时间（30分钟）。有更聪明的方法吗？谢谢。

博维尔上校

如果df是data.frame“大”数据的原始格式，建议使用data.tablepackage：

library(data.table)

dt = data.table(df)
setkey(dt, user)

dt[,list(min(value), max(value)),by=user]
    user V1 V2
1: USER1  1 55
2: USER5  4  8
3: USER3  6  9
4: USER2  2 15

编辑：很好的例子，在使用each来自plyr！

> library(plyr)
> dt[,as.list(each(min,max)(value)),by=user]
    user min max
1: USER1   1  55
2: USER5   4   8
3: USER3   6   9
4: USER2   2  15

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-10-27

我来说两句

0 条评论

登录后参与评论

上一篇：ANSI转义序列保存/恢复光标位置支持

如何从包含以下因素的数据帧子集中获取最小值和最大值

如何在r的数据框中找到数字wrt的最大值和最小值？

在一个日期之后使用另一个变量的值达到该日期的最大值/最小值的日期之后分割数据帧

从ArrayList中删除一个最大值和最小值

Python数据帧计算元素列表的最小值和最大值

计算数据帧的最小值和最大值时出现类型错误

用java写两种方法的最小值和最大值，以找到最大值和链表中的最小值，但输入列表是一个整数数组

如何创建一个函数来计算和返回平均值、最大值和最小值？

数组的总和，而忽略一个最小值和一个最大值

我在 Python 中编写了一个代码来从 5 个元素的数组中找到 4 个元素的最大值和最小值

如何从向量中删除一个最大值和一个最小值？

如何在数据框中的变量中找到一组中最大值和最小值的差异

SwiftUI如何给滑块一个最小值和最大值，并在Text中显示其值？

如何基于另一个数据框的最小值和最大值创建列

计算数据框中列的最大值、平均值和最小值

使用Group BY通过一个MySQL查询获取最小值和最大值

是否有一个函数返回最小值和最大值之间的整数？

如何在同一个表中设置最小值和最大值？

在最大值和最小值之间找到一个数字，并在该范围内生成一个随机整数

如何从 R 中跨多个数据帧的公共列中找到最大值/最小值

如何找到数据帧或矩阵的最小值/最大值的位置（行/列）（R问题）

计算由数据帧 R 中的另一个变量分组的最大连续重复非 NA 值

创建一个新变量，它是python中另一个变量的每周最小值/最大值

在 R 中的 ddply 中获取数据帧中子组列的最大值和最小值

在数据结构中找到最大值最小值和最大键值

熊猫找到当地的最大值和最小值

找到最小值+最大值和关联的列

如何找到最大值和最小值

在第一个数据框给定的2个日期之间找到第二个数据框的最小值和最大值

TOP 榜单

文章

计算非收费算法，以找到大数据帧中变量wrt的最小值和最大值的一个因素？

计算非收费算法，以找到大数据帧中变量wrt的最小值和最大值的一个因素？

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称