熊猫groupby + transform和多列

Willem 发表于 Dev

威廉

为了获得对groupby数据执行的具有与原始DataFrame相同的详细程度的结果（相同的观察计数），我使用了转换功能。

示例：原始数据框

name, year, grade
Jack, 2010, 6
Jack, 2011, 7
Rosie, 2010, 7
Rosie, 2011, 8

分组变换后

name, year, grade, average grade
Jack, 2010, 6, 6.5
Jack, 2011, 7, 6.5
Rosie, 2010, 7, 7.5
Rosie, 2011, 8, 7.5

但是，如果使用基于多列的更高级的功能，事情就会变得更加复杂。让我感到困惑的是，我似乎无法访问groupby-transform组合中的多个列。

df = pd.DataFrame({'a':[1,2,3,4,5,6],
               'b':[1,2,3,4,5,6],
               'c':['q', 'q', 'q', 'q', 'w', 'w'],  
               'd':['z','z','z','o','o','o']})

def f(x):
 y=sum(x['a'])+sum(x['b'])
 return(y)

df['e'] = df.groupby(['c','d']).transform(f)

给我：

KeyError: ('a', 'occurred at index a')

虽然我知道以下方法确实有效：

df.groupby(['c','d']).apply(f)

是什么导致了这种现象，以及如何获得这样的结果：

a   b   c   d   e
1   1   q   z   12
2   2   q   z   12
3   3   q   z   12
4   4   q   o   8
5   5   w   o   22
6   6   w   o   22

哈里穆尔·阿里（Haleemur Ali）

对于这种特殊情况，您可以执行以下操作：

g = df.groupby(['c', 'd'])

df['e'] = g.a.transform('sum') + g.b.transform('sum')

df
# outputs

   a  b  c  d   e
0  1  1  q  z  12
1  2  2  q  z  12
2  3  3  q  z  12
3  4  4  q  o   8
4  5  5  w  o  22
5  6  6  w  o  22

如果您可以通过对同一groupby进行独立变换的线性组合来构造最终结果，则此方法有效。

否则，您将使用groupby-apply，然后合并回原始df。

例：

_ = df.groupby(['c','d']).apply(lambda x: sum(x.a+x.b)).rename('e').reset_index()
df.merge(_, on=['c','d'])
# same output as above.

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-26

我来说两句

0 条评论

登录后参与评论

上一篇：python迭代字典值（如果一个键具有一个或多个值）

熊猫-Groupby多列

熊猫groupby和countif在多列中

熊猫groupby（），transform（）和ffill（）

在熊猫中使用groupby和transform时保持'key'列

熊猫，groupby和count

熊猫Multiindex和Groupby

熊猫groupby和filter

熊猫groupby和qcut

熊猫groupby，包含和

Groupby和熊猫样本

groupby 和 for 循环与熊猫

Groupby和循环熊猫

了解groupby和熊猫

熊猫groupby删除列

熊猫groupby丢弃列

python-熊猫：groupby填充多列

熊猫groupby max-多列

来自groupby的多列熊猫加入

熊猫的groupby（）和索引值

熊猫：过滤groupby和/或透视？

熊猫groupby和减行

熊猫groupby和boolean选择

熊猫Groupby sum和concatenate

熊猫：groupby和可变权重

熊猫groupby和组的总和

熊猫DataFrame Groupby和改革

熊猫groupby和滚动窗口

链接groupby和应用熊猫

熊猫动态Groupby和Shift

TOP 榜单

文章

熊猫groupby + transform和多列

熊猫groupby + transform和多列

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数