我有一个带有祖鲁时区的字符串格式的日期。我试图用正则表达式摆脱“Z”字符,但我想有一种更有效的方法。
输入:
|index | date | municipality
|------| --------------------|--------------
| 0 | 07.02.2021 1017Z | Algier
| 1 | 11.01.2019 1716Z | Abuja
| 2 | 23.02.2018 1002Z | Brüssel
| 3 | 19.07.2021 1459Z | Brüssel
| 4 | 26.11.2019 1049Z | Berlin
期望的结果:
|index | date | municipality
|------| --------------------|--------------
| 0 | 2021-02-17 | Algier
| 1 | 2019-01-11 | Abuja
| 2 | 2018-02-23 | Bruxelles
| 3 | 2021-07-19 | Bruxelles
| 4 | 2019-11-26 | Berlin
不要摆脱 Z 字符,而是正确解析它。前任:
import pandas as pd
df = pd.DataFrame({'date': ['07.02.2021 1017Z', '11.01.2019 1716Z']})
df['date'] = pd.to_datetime(df['date'], format='%d.%m.%Y %H%M%z')
# df['date']
# Out[19]:
# 0 2021-02-07 10:17:00+00:00
# 1 2019-01-11 17:16:00+00:00
# Name: date, dtype: datetime64[ns, UTC]
请注意,设置format
关键字是可选的,但明确指定它有助于提高一般可靠性。
如果您不想要它们,您也可以减少时间:
df['date'] = df['date'].dt.floor('D')
# df['date']
# Out[21]:
# 0 2021-02-07 00:00:00+00:00
# 1 2019-01-11 00:00:00+00:00
# Name: date, dtype: datetime64[ns, UTC]
...或格式化为字符串:
df['date'].dt.strftime('%Y-%m-%d')
# 0 2021-02-07
# 1 2019-01-11
# Name: date, dtype: object
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句