如何使用Pandas Groupby计算每列中总计的百分比

卢卡斯·里斯(Lucas Reis)

我有一个包含4列的数据框:id,color,flag_1和flag_2:

df = pd.DataFrame({'id': range(0,5),
                   'color': ['red', 'red', 'blue', 'blue', 'blue'],
                   'flag_1':[1, 0, 0, 0, 0],
                  'flag_2':[1, 1, 1, 1, 0]})

从这个问题的不同:与GROUPBY共有大熊猫百分比,我想通过组列的颜色,并得到总的百分比,flag_1和flag_2。

结果应如下图所示:

color    flag_1  flag_2
red       0.5     1
blue       0     0.67

我似乎无法弄清楚如何根据引用的问题(仅汇总一列)使代码适应我的需求。

sammywemmy

尝试crosstab

m = df.drop("id", axis=1).melt("color")
pd.crosstab(m.color, m.variable, m.value, aggfunc="mean").rename_axis(None)


variable    flag_1  flag_2
blue         0.0    0.666667
red          0.5    1.000000

坚持groupby:

df.groupby("color", sort=False).agg(flag1=("flag_1", "mean"), flag2=("flag_2", "mean"))


       flag1    flag2
color       
red     0.5     1.000000
blue    0.0     0.666667

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用groupby计算总计的百分比

如何计算每一列的百分比?

如何计算 SQL Server 中每列中特定值出现的百分比

如何使用groupby计算熊猫数据框中特定列的总数百分比?

使用dplyr计算每列中NA的百分比

如何计算列中的百分比?

如何计算r中的列百分比

pandas groupby:如何计算总数百分比?

如何使用大熊猫中的groupby根据另一列中的条件计算百分比总数

如何获取groupby总数然后计算Pandas DataFrame列的百分比

如何获得SQL汇总中的总计百分比?

计算Pandas DataFrame中每滚动n行之间的变化百分比

如何计算SQL Server 2012中每一行的百分比?

如何计算多级索引groupby的百分比?

Pandas:每一列的nan的百分比

使用pyspark计算groupBy总数的百分比

如何计算groupby列的百分比并按降序排序?

如何在Python中的groupby中计算计数和百分比

如何计算groupby /数据透视表中特定响应的百分比?

使用 bigquery 中的 groupby 函数计算 COUNT 的百分比

Pandas Group由两列组成,基于一列计算总计,但基于聚合器的总计计算百分比

如何使用Mongo聚合功能来计算嵌套组的总计和小计百分比?

如何在图中显示数据框中每列的最高百分比

获取基于Pandas中groupby的百分比?

如何计算和计算R data.frame中两列的百分比?

使用dplyr计算一列中按组计算的百分比,而忽略空白

如何绘制groupby在seaborn中的百分比?

如何计算多列的百分比

如何计算文件的列百分比?