熊猫：groupby和聚合，而不会丢失被分组的列

物理：

我有一个熊猫数据框，如下所示。对于每个ID，我可以有多个名称和子ID。

Id      NAME   SUB_ID
276956  A      5933
276956  B      5934
276956  C      5935
287266  D      1589

我想压缩数据框，以便每个id只有一行，并且每个id下的所有名称和sub_ids在该行上都显示为单数形式

Id      NAME           SUB_ID
276956  set(A,B,C)     set(5933,5934,5935)
287266  set(D)         set(1589)

我尝试对ID进行分组，然后汇总所有其他列

df.groupby('Id').agg(lambda x: set(x))

但是这样做时，结果数据框没有Id列。当您执行groupby时，id将作为元组的第一个值返回，但是我想您聚合时会丢失。有没有一种方法来获取我要寻找的数据框。那就是分组和聚集而不丢失被分组的列。

臀部：

如果您不希望groupby作为索引，可以使用一个参数来避免进一步重置：

df.groupby('Id', as_index=False).agg(lambda x: set(x))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-07-7

我来说两句

0 条评论

登录后参与评论

pandas dataframe groupby 不会丢失被分组的列

基于先前的 groupby() 探索分离 DataFrame 的 Pandas 方法，而不会丢失未分组的列

使用熊猫数据帧如何聚合和GROUPBY和非聚集/ GROUPBY列带来

哪种熊猫操作可以帮助我进行分组和按列组合聚合？

在熊猫数据框中使用groupby和聚合时，如何从另一列连接日期

熊猫聚合分组

按多列分组和聚合

PySpark 基于不同列的分组和聚合？

熊猫：具有多种功能的分组和聚合

分组和聚合熊猫DataFrame以获取摘要DataFrame

按熊猫分组创建两个聚合列

熊猫-分组依据：使用多列创建聚合函数

datetime列的简化熊猫分组方式聚合

如何计算熊猫中列的分组和加权聚合？

Groupby和命名聚合| 优化熊猫中的数据帧生成

dask：如何进行分组依据，聚合而不丢失用于分组依据的列

多个列的熊猫分组比和加权和

熊猫按列和计数值分组

如何设置和分组熊猫多级列？

熊猫中的分组和列差异计算

在熊猫中分组和减列

熊猫：转置，分组和汇总列

熊猫按时间和列值分组

熊猫：按功能分组并聚合

通过递归多索引对熊猫进行分组而不会丢失其他索引

熊猫groupby，而不将按列分组变成索引

ElasticSearch 分组和聚合

熊猫 groupby 聚合到 dask

熊猫groupby和countif在多列中

TOP 榜单

文章

熊猫：groupby和聚合，而不会丢失被分组的列

熊猫：groupby和聚合，而不会丢失被分组的列

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数