如何对按熊猫中的分类列分组的值求和?

因子

我有一个具有分类列的数据,该分类列将数据分组,而其他列在数据框中像这样df

id      subid      value
1       10         1.5
1       20         2.5
1       30         7.0 
2       10         12.5
2       40         5

我需要的是一个为每种平均值列subid中的每个id例如df可能是:

id      subid      value     id_sum    proportion
1       10         1.5       11.0      0.136
1       20         2.5       11.0      0.227
1       30         7.0       11.0      0.636
2       10         12.5      17.5      0.714
2       40         5         17.5      0.285

现在,我尝试通过执行以下操作获取id_sum列:

df['id_sum'] = df.groupby('id')['value'].sum()

但这似乎没有达到预期的效果。我的最终目标是获得proportion专栏。什么是正确的方法呢?

ℕʘʘḆḽḘ

开始了

df['id_sum'] = df.groupby('id')['value'].transform('sum')
df['proportion'] = df['value'] / df['id_sum']

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章