熊猫groupby多列基础日期按纪元周

Django0602

我想总结一下我在数据框中基于日期列的三列。这里的要点是,总结应该在时代周的范围内进行。例如:第14周是2020年3月30日至2020年4月5日,第15周是2020年4月6日至2020年4月15日,依此类推。date_time列已采用正确的日期时间格式。时代周可以在这里找到:epochweek

我的数据框如下所示:

   date_time                    A        B
0  01/04/2020  00:00:00         5        10
1  02/04/2020  00:00:00         5        10
2  03/04/2020  00:00:00         1        10
3  07/04/2020  00:00:00         2        10
4  08/04/2020  00:00:00         2        10
5  10/04/2020  00:00:00         3        10

输出应如下所示:

epoch_week       sum_A       sum_B
week14           11          30
week15           7           30
Total            18          60
耶斯列尔

使用Series.dt.weekofyear带有日期时间和集合sum

g = pd.to_datetime(df['date_time'], dayfirst=True).dt.weekofyear

df = df.groupby(g.rename('epoch_week')).sum().reset_index()
print (df)
   epoch_week   A   B
0          14  11  30
1          15   7  30

编辑:

g = pd.to_datetime(df['date_time'], dayfirst=True).dt.weekofyear

df = df.groupby(g.rename('epoch_week')).sum()
df.loc['Total'] = df.sum()
df = df.reset_index()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章