我有一个数据框。我已使用日期按日期对列状态进行了分组
y = news_dataframe.groupby(by=[news_dataframe['date'].dt.date,news_dataframe['status']])['status'].count()
我的输出是-
date status count
2019-05-29 selected 24
rejected auto 243
waiting 109
no action 1363
2019-05-30 selected 28
rejected auto 188
waiting 132
no action 1249
repeat 3
2019-05-31 selected 13
rejected auto 8
waiting 23
no action 137
repeat 2
source 1
Name: reasonForReject, dtype: int64
现在,我想按日期计算每个状态组的百分比。如何使用pandas数据框实现此目标?
计算两个不同的groupby,然后彼此除以:
y_numerator = news_dataframe.groupby(by=[news_dataframe['date'].dt.date,news_dataframe['status']])['status'].count()
y_denominator = news_dataframe.groupby(by=news_dataframe['date'].dt.date)['status'].count()
y=y_numerator/y_denominator
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句