带有 bin sum 聚合的 Pandas Groupby

数据科学32

我有一个类似的问题这一个

我在 Pandas 中有一个数据框，看起来像这样 - 显示不同用户获奖的年龄。

ID	奖项	年龄
1	100	24
1	150	26
1	50	54
2	193	34
2	209	50

有兴趣计算年龄区间的总奖励，即 0（0-8 岁）、1（9-17 岁）、2（18-26 岁）、3（27-35 岁）、4（26-44 岁）岁）……等等。每个人都应该有尽可能多的年龄间隔。

我怎样才能按 id 和 9 岁的年龄间隔对它们进行分组以获得这样的结果：

ID。	total_awards	年龄间隔
1	0	0
1	0	1
1	250	2
1	0	3
1	0	4
1	0	5
1	50	6
2	0	0
2	0	1
2	0	2
2	193	3
2	0	4
2	209	5
2	0	6

海豆

您可以按如下方式定义分箱和切割：

bins = [9 * i for i in range(0, df['age'].max() // 9 + 2)]
cuts = pd.cut(df['age'], bins, right=False)

print(cuts)

0    [18, 27)
1    [18, 27)
2    [54, 63)
3    [27, 36)
4    [45, 54)
Name: age, dtype: category
Categories (7, interval[int64, left]): [[0, 9) < [9, 18) < [18, 27) < [27, 36) < [36, 45) < [45, 54) < [54, 63)]

然后， group by idand thecuts和 sum awardsfor the cut to get total_awards。创建age_interval者GroupBy.cumcount()

df_out = (df.groupby(['id', cuts])
            .agg(total_awards=('awards', 'sum'))
            .reset_index(level=0)
            .reset_index(drop=True)
         )
df_out['age_interval'] = df_out.groupby('id').cumcount()

结果：

print(df_out)

    id  total_awards  age_interval
0    1             0             0
1    1             0             1
2    1           250             2
3    1             0             3
4    1             0             4
5    1             0             5
6    1            50             6
7    2             0             0
8    2             0             1
9    2             0             2
10   2           193             3
11   2             0             4
12   2           209             5
13   2             0             6

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-6

我来说两句

0 条评论

登录后参与评论

上一篇：如果没有单击链接就损坏了，请检查 MS-Access 上的超链接字段

带有 bin sum 聚合的 Pandas Groupby

带有 bin sum 聚合的 Pandas Groupby

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接