分组并在日期之间添加具有最小值的新列 - 熊猫

托尼诺·费尔南德斯

我有这个熊猫数据框:

在此处输入图片说明

我想要一个新的 DF 将它们按 ['ticked_id','time_a'] 分组并添加一个具有最小时间差异 (hh) 的新列,SQL 代码有效:

SELECT ticket_id, DATEDIFF('hh', time_a, MIN(time_b)) each_diff from ...

我试图将它们分组,但结果是一个我看不到的对象

丹尼尔·怀亚特

要将数据分组并获取列的最小日期time_b列,您可以执行以下操作:

df_grouped = df.groupby(['ticket_id', 'time_a'])['time_b'].min().reset_index()

我不知道您time_atime_b的数据类型,但如果它们是时间戳,您可以执行以下操作以获取小时数差异:

df_grouped['each_diff'] = (df_grouped['time_b'] - df_grouped['time_a').astype('timedelta64[h]')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章