熊猫：如何从“周”和“年”创建日期时间对象？

赫里斯（Khris）：

我有一个数据框，它提供两个整数列，分别是年份和年份：

import pandas as pd
import numpy as np
L1 = [43,44,51,2,5,12]
L2 = [2016,2016,2016,2017,2017,2017]
df = pd.DataFrame({"Week":L1,"Year":L2})

df
Out[72]: 
   Week  Year
0    43  2016
1    44  2016
2    51  2016
3     2  2017
4     5  2017
5    12  2017

我需要从这两个数字创建一个datetime-object。

我试过了，但是抛出一个错误：

df["DT"] = df.apply(lambda x: np.datetime64(x.Year,'Y') + np.timedelta64(x.Week,'W'),axis=1)

然后我尝试了一下，它可以工作，但是给出了错误的结果，即它完全忽略了一周：

df["S"] = df.Week.astype(str)+'-'+df.Year.astype(str)
df["DT"] = df["S"].apply(lambda x: pd.to_datetime(x,format='%W-%Y'))

df
Out[74]: 
   Week  Year        S         DT
0    43  2016  43-2016 2016-01-01
1    44  2016  44-2016 2016-01-01
2    51  2016  51-2016 2016-01-01
3     2  2017   2-2017 2017-01-01
4     5  2017   5-2017 2017-01-01
5    12  2017  12-2017 2017-01-01

我真的迷失在Python datetime，Numpy datetime64和Pandas之间Timestamp，您能告诉我它是如何正确完成的吗？

我正在使用Python 3，如果这在任何方面都有意义的话。

编辑：

从Python 3.8开始，可以使用针对datetime.date对象的新引入的方法轻松解决此问题：https : //docs.python.org/3/library/datetime.html#datetime.date.fromisocalendar

MaxU：

尝试这个：

In [19]: pd.to_datetime(df.Year.astype(str), format='%Y') + \
             pd.to_timedelta(df.Week.mul(7).astype(str) + ' days')
Out[19]:
0   2016-10-28
1   2016-11-04
2   2016-12-23
3   2017-01-15
4   2017-02-05
5   2017-03-26
dtype: datetime64[ns]

最初我有时间戳 s

从UNIX纪元时间戳解析它要容易得多：

df['Date'] = pd.to_datetime(df['UNIX_Time'], unit='s')

10M行DF的计时：

设定：

In [26]: df = pd.DataFrame(pd.date_range('1970-01-01', freq='1T', periods=10**7), columns=['date'])

In [27]: df.shape
Out[27]: (10000000, 1)

In [28]: df['unix_ts'] = df['date'].astype(np.int64)//10**9

In [30]: df
Out[30]:
                       date    unix_ts
0       1970-01-01 00:00:00          0
1       1970-01-01 00:01:00         60
2       1970-01-01 00:02:00        120
3       1970-01-01 00:03:00        180
4       1970-01-01 00:04:00        240
5       1970-01-01 00:05:00        300
6       1970-01-01 00:06:00        360
7       1970-01-01 00:07:00        420
8       1970-01-01 00:08:00        480
9       1970-01-01 00:09:00        540
...                     ...        ...
9999990 1989-01-05 10:30:00  599999400
9999991 1989-01-05 10:31:00  599999460
9999992 1989-01-05 10:32:00  599999520
9999993 1989-01-05 10:33:00  599999580
9999994 1989-01-05 10:34:00  599999640
9999995 1989-01-05 10:35:00  599999700
9999996 1989-01-05 10:36:00  599999760
9999997 1989-01-05 10:37:00  599999820
9999998 1989-01-05 10:38:00  599999880
9999999 1989-01-05 10:39:00  599999940

[10000000 rows x 2 columns]

校验：

In [31]: pd.to_datetime(df.unix_ts, unit='s')
Out[31]:
0         1970-01-01 00:00:00
1         1970-01-01 00:01:00
2         1970-01-01 00:02:00
3         1970-01-01 00:03:00
4         1970-01-01 00:04:00
5         1970-01-01 00:05:00
6         1970-01-01 00:06:00
7         1970-01-01 00:07:00
8         1970-01-01 00:08:00
9         1970-01-01 00:09:00
                  ...
9999990   1989-01-05 10:30:00
9999991   1989-01-05 10:31:00
9999992   1989-01-05 10:32:00
9999993   1989-01-05 10:33:00
9999994   1989-01-05 10:34:00
9999995   1989-01-05 10:35:00
9999996   1989-01-05 10:36:00
9999997   1989-01-05 10:37:00
9999998   1989-01-05 10:38:00
9999999   1989-01-05 10:39:00
Name: unix_ts, Length: 10000000, dtype: datetime64[ns]

定时：

In [32]: %timeit pd.to_datetime(df.unix_ts, unit='s')
10 loops, best of 3: 156 ms per loop

结论：我认为156毫秒转换10.000.000行并不那么慢

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-06-1

我来说两句

0 条评论

登录后参与评论

熊猫：如何创建年周变量？

在Python中，如何获取基于年，周和周的日期？

如何剥离日期，小时和秒的熊猫日期时间

如何隐藏熊猫中日期时间对象的格式

从dask数据框中的日期时间序列中获取年和周？

从乱序日期在熊猫中创建日期时间对象

熊猫-如何将列转换为日期时间对象

熊猫日期时间周与预期不符

使用熊猫将一年中的星期解析为日期时间对象

截断日期时间对象熊猫

如何按周和年绘制时间序列数据？

如何为熊猫的日期时间设置缺少的年，月和日

熊猫：如何填写缺少的“年，周”列？

如何从熊猫日期时间对象计算均值和方差？

在熊猫中将“年”和“年的周”列转换为“日期”

结合年，月，周和日期

如何在bigquery中根据年，周和日创建日期

Dart日期时间差异，以周，月和年为单位

合并年和周列以在Python中创建日期时间和排序

将年和周的整数格式化为日期时间

如何将字符串数据框列转换为日期时间和年和周的格式？

如何访问文件创建的日期和时间？

熊猫动态日期时间周开始

如何复制熊猫日期时间对象

如何显示自日期以来的年、月、周和日

特定对象创建日期和时间

根据日期时间变量创建周变量

将年和周的整数更改为日期时间

从 PHP 中的日期时间获取月份名称和年复一周

TOP 榜单

文章

熊猫：如何从“周”和“年”创建日期时间对象？

熊猫：如何从“周”和“年”创建日期时间对象？

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException