根据另一个熊猫中开始日期和结束日期列的条件创建新的熊猫数据框

Sunny 发表于 Dev

阳光明媚

我在熊猫数据框中有开始日期时间和结束日期时间列，如下所示。

如果结束日期和时间更改为另一天或另一小时，我需要创建一个新行，开始时间为下一小时的开始时间，结束时间为该小时的结束时间（如果原始结束时间 > 小时）或等于原始数据中的结束时间（如果原始结束时间 < 当前小时）并且很快。得到的预期表如下所示。

Pandas 是否有可能，因为我的数据在数据框中

阿米特·维克拉姆·辛格

计算之间的差小时Start_Time和End_Time（称之为length），然后通过重复每一行length使用倍df.reindex(df.reindex.repeat(...))。然后从分配一个计数器0以length-1由开始日期创建的每个组中的行，分别。

然后对于Start_Time，只要计数器不为零（即这不是该日期的起始行），将时间四舍五入到计数器hh:00:00并递增hour。

对于End_Time，只要计数器不等于length-1（即这是不是该日期的最后一行），设置End_Time为Start_Time不过分，秒复位为59即格式如下：hh:59:59其中，小时是从Start_Time。

使用：

df = (pd.DataFrame({
        'Start_Time': ['2019-08-29 17:29:29', 
              '2019-09-04 17:29:25', '2019-09-25 10:16:32'], 
        'End_Time': ['2019-08-29 17:32:18', 
              '2019-09-04 18:14:41', '2019-09-26 13:01:26']}))
df.Start_Time = pd.to_datetime(df.Start_Time)
df.End_Time = pd.to_datetime(df.End_Time)
timeDiff = df.End_Time.dt.floor(freq = 'H') - df.Start_Time.dt.floor(freq = 'H')

df['length'] = (timeDiff.dt.days * 24 + timeDiff.dt.seconds//3600 + 1)

df = df.reindex(df.index.repeat(df['length'])).reset_index(drop = True)
df['counter'] = (df.groupby(df.Start_Time.dt.date)['length']
                        .transform(lambda x: np.arange(x.iloc[0])))

mask = df.counter.eq(0)
(df.Start_Time.where(mask, df.Start_Time.dt.round('H') + 
              pd.to_timedelta(df.counter, unit = 'h'), inplace = True))


mask = df.length.eq(df.counter + 1)
masked_val = ((pd.to_timedelta(1, unit = 'h') + 
                df.Start_Time.dt.floor(freq = 'H'))
              .dt.ceil(freq = 'H') + pd.to_timedelta(-1, unit = 'S'))    

df.End_Time.where(mask, masked_val, inplace = True)
df.drop(columns = df.columns[2:], axis = 1, inplace = True)

输出：

>>> df
              Start_Time            End_Time
0  2019-08-29 17:29:29 2019-08-29 17:32:18
1  2019-09-04 17:29:25 2019-09-04 17:59:59
2  2019-09-04 18:00:00 2019-09-04 18:14:41
3  2019-09-25 10:16:32 2019-09-25 10:59:59
4  2019-09-25 11:00:00 2019-09-25 11:59:59
5  2019-09-25 12:00:00 2019-09-25 12:59:59
...
28 2019-09-26 11:00:00 2019-09-26 11:59:59
29 2019-09-26 12:00:00 2019-09-26 12:59:59
30 2019-09-26 13:00:00 2019-09-26 13:01:26

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-24

我来说两句

0 条评论

登录后参与评论

上一篇：在python中打印列表中小于最后一个数字的所有数字

TOP 榜单

文章

根据另一个熊猫中开始日期和结束日期列的条件创建新的熊猫数据框

根据另一个熊猫中开始日期和结束日期列的条件创建新的熊猫数据框

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用