索引熊猫数据框以返回每天的第一个数据点

麦可

在Pandas中,我有一datetime列(而不是索引)中带有s的DataFrame ,它跨越几天,并且处于不规则的时间间隔(即非周期性)。我想每天返回第一个值。因此,如果我的datetime专栏看起来像:

2013-01-01 01:00
2013-01-01 05:00
2013-01-01 14:00
2013-01-02 01:00
2013-01-02 05:00
2013-01-04 14:00

我正在寻找的命令将返回以下索引的数据框列:

2013-01-01 01:00
2013-01-02 01:00
2013-01-04 14:00
算了吧

使用此设置:

import pandas as pd
data = '''\
2013-01-01 01:00
2013-01-01 05:00
2013-01-01 14:00
2013-01-02 01:00
2013-01-02 05:00
2013-01-04 14:00'''
dates = pd.to_datetime(data.splitlines())
df = pd.DataFrame({'date': dates, 'val': range(len(dates))})

>>> df
                 date  val
0 2013-01-01 01:00:00    0
1 2013-01-01 05:00:00    1
2 2013-01-01 14:00:00    2
3 2013-01-02 01:00:00    3
4 2013-01-02 05:00:00    4
5 2013-01-04 14:00:00    5

您可以使用groupby生成所需的DataFrame agg

grouped = df.groupby([d.strftime('%Y%m%d') for d in df['date']])
newdf = grouped.agg('first')
print(newdf)

产量

                        date  val
20130101 2013-01-01 01:00:00    0
20130102 2013-01-02 01:00:00    3
20130104 2013-01-04 14:00:00    5

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫数据框concat返回第一个数据框的相同数据

熊猫-每天比较2个数据框以查找第一个实例,其中值是第一个数据框的倍数

熊猫插值法在最后一个数据点之后而不是第一个数据点之前替换NaN

在 Pandas 中过滤时间序列数据框以每分钟给出第一个数据点

熊猫-从日期时间数据框中获取每天的第一个和最后一个值

从熊猫数据框中找到值的第一个匹配项(从值列表中查找)并返回该行的索引

熊猫:如何通过保留第一个数据框的信息来合并两个数据框?

获取带有偏移索引的熊猫数据框中的列的第一个值

按熊猫数据框唯一的第一个值分组 - 返回 numpy 数组

ggplot2和一行中的第一个数据点

Plotly - 从第一个数据点开始 X 轴

从第一个数据点开始发布需要的线图

熊猫groupby申请返回一个数据框

使用给定值将pandas DataFrame填充到第一个数据点和最后一个数据点

熊猫索引插值填充最后一个数据点之后的缺失值

遍历一个数据框中的单个列与另一个数据框中的列进行比较使用熊猫在第一个数据框中创建新列

将两个大熊猫数据框与第一个索引相连吗?

如何在Python熊猫数据框中的NaN之间的序列中冻结第一个数字

我的第一个和最后一个数据点的 sns regplot 剪切

大熊猫每天将小时(仅小时)放入一个数据框中

将数据框中的两列匹配到另一个数据框中的多个列,并返回第一个匹配列

熊猫-通过另一个数据框索引数据框

pandas - 每天获取一个数据框

从ms sql中的第一个数据中减去最后一个数据,但每天都要这样做

如何从多索引数据框中获取第一个二级索引?

Python:如何通过保留第一个数据框的信息来合并两个数据框?

在两个数据框中匹配行的第一个数据框中查找位置

SSRS图表组系列-如何使第二系列组从第一个数据点开始?

如何从熊猫数据框中计算从一个数据点到所有其他数据点的欧几里得距离之和?