从dask数据框中的日期时间序列中获取年和周?

用户名

如果我有一个Pandas数据框,并且是一个日期时间类型的列,则可以按以下方式获得年份:

df['year'] = df['date'].dt.year

如果数据框不够清晰,那是行不通的。如果我先计算,像这样:

df['year'] = df['date'].compute().dt.year

我得到ValueError: Not all divisions are known, can't align partitions. Please useset_index orset_partitionto set the index.

但是,如果我这样做:

df['date'].head().dt.year

它工作正常!

那么,如何在快速数据框中获得日期时间序列的年(或周)呢?

麦考林

.dt日期时间命名空间是存在于DASK一系列对象。这是其使用的自包含内容:

In [1]: import pandas as pd

In [2]: df = pd.util.testing.makeTimeSeries().to_frame().reset_index().head(10)

In [3]: df  # some pandas data to turn into a dask.dataframe
Out[3]: 
       index         0
0 2000-01-03 -0.034297
1 2000-01-04 -0.373816
2 2000-01-05 -0.844751
3 2000-01-06  0.924542
4 2000-01-07  0.507070
5 2000-01-10  0.216684
6 2000-01-11  1.191743
7 2000-01-12 -2.103547
8 2000-01-13  0.156629
9 2000-01-14  1.602243

In [4]: import dask.dataframe as dd

In [5]: ddf = dd.from_pandas(df, npartitions=3)

In [6]: ddf['year'] = ddf['index'].dt.year  # use the .dt namespace

In [7]: ddf.head()
Out[7]: 
       index         0  year
0 2000-01-03 -0.034297  2000
1 2000-01-04 -0.373816  2000
2 2000-01-05 -0.844751  2000
3 2000-01-06  0.924542  2000

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

从Pandas数据框中删除时间戳,日期和月份以获取时间序列图

在Python中,如何获取基于年,周和周的日期?

从 PHP 中的日期时间获取月份名称和年复一周

获取时间序列数据框中每个日期的最后一个条目

如何按周和年绘制时间序列数据?

合并年和周列以在Python中创建日期时间和排序

如何将字符串数据框列转换为日期时间和年和周的格式?

如何在python中获取数据序列的开始和结束日期时间段?

如何在C中从一年和iso周中获取日期#

python从输入序列中获取最大日期和最大时间

从数据框列中获取正确的日期时间对象,其中包含带有日期和时间的随机字符串

pyspark 数据框中的聚合和一年中的一周

从熊猫数据框中获取前后日期时间

从数据框中获取作为日期时间对象的索引

如何在Spark中获取日期的年和周编号对齐

从pandas数据框中的字符串日期获取一年中的日期

如何在熊猫数据框中删除日期和时间?

基于 Pandas 中的时间序列创建一个数月 x 年的数据框

从MSSQL中的年和周号构造日期

Excel 2007公式从年和周中找出日期?

如何从日期/时间选择器对话框中获取日期和时间并显示它?

熊猫数据框中的时间序列

在python中合并时间序列数据框

使用 zoo 包在 R 中的时间序列数据中填充缺失的日期和时间

熊猫-从事件的数据框中创建一个10分钟的时间序列,并带有开始和结束日期和时间

如何根据不同数据帧中的开始日期和结束日期从时间序列中提取数据?

从熊猫数据框中获取最小和最大日期

从熊猫数据框中获取多个最小和最大日期

从日期时间类型的一个数据框列中创建年,月,日