分组以返回全部数据,而不仅仅是我分组的数据

亚历山大·库斯

是否可以返回全部数据而不仅仅是我们分组的一部分?

我的意思是例如 - 我有一个包含 5 列的数据框,其中一列包含distance,另一timestamp,最后一个重要的是name. 我通过timestamp应用的 agg 函数对数据帧进行分组(min) on distance作为回报,我得到了带有时间戳和距离的正确分组数据帧 - 我如何在name那里添加列如果我也将它分组,name那么timestamp它就会重复——它必须保持独特作为最终结果,我需要获得这样的数据框:

时间戳 姓名 距离
2020-03-03 15:30:235 比利 123
2020-03-03 15:30:435 约翰尼 111

但是我得到了这个:

时间戳 距离
2020-03-03 15:30:235 123
2020-03-03 15:30:435 111

整个表有超过 700k 行,所以重新加入它distance给了我我的 PC 甚至无法处理的行数。

这是我的groupby,它给了我第二张桌子:

grouped_df = df1.groupby('timestamp')['distance'].min()

这是我为了name进入桌子而尝试做的事情

grouped_df.merge(df1, how='left', left_on=['timestamp','distance'],    
right_on = ['timestamp','distance'])

贝尼

你试一试

out = df.sort_values('distance').drop_duplicates('timestamp')

然后尝试 transform

m = df.groupby('timestamp')['distance'].transform('min')
dout = df[df.distance==m]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

OpenWhisk 返回整个响应对象而不仅仅是数据

在 .filter 之后返回整个数据集,而不仅仅是过滤的对象

函数返回 json 而不仅仅是值

astype('float')更改数据,而不仅仅是数据类型

我们可以为数据创建迁移,而不仅仅是表的结构吗?

将数据发布到外部网站,而不仅仅是您自己的网站

Angular 8-Typescript-捕获订阅中的数据错误,而不仅仅是标题

Django 文件上传(获取文件数据,而不仅仅是文件路径)

rsample::bootstraps 是否存储数据而不仅仅是行索引?

显示外键数据(名称等),而不仅仅是 HTML 表中的外键

遍历行,数据,而不仅仅是在Jinja模板中打印表

用于整个数据集的逻辑回归返回结果的预测函数,而不仅仅是训练数据集

谷歌分析捕获测试站点数据和产品,而不仅仅是产品数据

如何保存所有绑定的数据,而不仅仅是可见页面的数据

Amplify.DataStore.query 返回所有用户创建的数据,而不仅仅是所有者

数据库将所有以前的迁移应用于更新,而不仅仅是新迁移

从文件夹中的文件列表中提取数据到母版,而不仅仅是复制和粘贴

根据用户输入更新数据表,包括相应列的更新,而不仅仅是已编辑的列

ORA-01790数据类型:如何添加使用名称中的文本的能力,而不仅仅是数字

查找数据框中所有行的情绪分析,而不仅仅是一行

从数据框中删除重复行的所有副本(而不仅仅是重复副本)

如何在选择查询中使用数据填充外键字段,而不仅仅是外键 ID?

如何将文件上传到数据库,而不仅仅是使用php的服务器

试图从数据库中删除匹配的所有内容,而不仅仅是 firstordefault

Pandas Groupby 返回 n 最小 - 返回整行而不仅仅是索引?

Pandas Groupby 返回 n 最小 - 返回整行而不仅仅是索引?

Redis-不仅仅是键查询

写的不仅仅是“你好”

不仅仅是事件触发相同的方法