使用熊猫的groupby只是删除重复的项目

罗曼·罗兹（Roman Rdgz）

我确定这是一个基本问题，但是我无法在此处找到正确的路径。

让我们假设这样一个数据框，告诉每个人每周吃多少水果：

    Name    Fruit    Amount
1   Jack    Lemon    3
2   Mary    Banana   6
3   Sophie  Lemon    1
4   Sophie  Cherry   10
5   Daniel  Banana   2
6   Daniel  Cherry   4

现在让我们假设我只想用创建一个条形图matplotlib，以显示整个镇上每周吃的每种水果的总量。为此，我必须对水果进行分组

熊猫作者在他的书中groupby将split-apply-combine操作描述为第一部分：因此，首先，groupby将转换DataFrame为DataFrameGroupBy对象。然后，使用诸如的方法sum，将结果组合到一个新的DataFrame对象中。完美，我现在可以创建我的水果图。

但我面临的问题是，当我不希望发生的事情sum，diff或者在所有应用任何操作，每个组成员。当我只想使用一个水果类型仅groupby保留DataFrame一行时会发生什么（当然，对于像这样简单的示例，我可以只获取带有的水果列表unique，但这不是重点）。

如果这样做，则返回的groupby是一个DataFrameGroupBy对象，而许多可使用的DataFrame操作则不使用DataFrameGroupBy。

我相信这个问题很容易避免，这让我很头疼。我如何DataFrame在groupby不应用任何聚合函数的情况下获得收益？是否有其他解决方法，甚至都没有使用groupby，因为我在翻译中迷路了？

阿米·塔沃里（Ami Tavory）

如果只需要一行，则可以使用groupby-first() + reset_index-的组合，它将保留每个组的第一行：

import pandas as pd

df = pd.DataFrame({'a': [1, 1, 2], 'b': [1, 2, 3]})
>>> df.groupby(df.a).first().reset_index()
    a   b
0   1   1
1   2   3

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-9

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

使用熊猫的groupby只是删除重复的项目

使用熊猫的groupby只是删除重复的项目

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数