我按时间顺序对DataFrame进行了排序,下面以这个为例:
import pandas as pd
import numpy as np
dates = pd.date_range('2011-04-01 00:00', periods=300, freq='min')
random_dates = pd.to_datetime(np.random.choice(dates, size=20,replace=False)).sort_values()
numbers = np.random.uniform(low=-1, high=1, size=(20,))
df = pd.DataFrame(index=random_dates, data=numbers)
如果我们打印它:
...
2011-04-01 02:03:00 -0.404476
2011-04-01 02:38:00 0.205260
2011-04-01 02:44:00 0.111812
2011-04-01 03:10:00 -0.071028
2011-04-01 03:55:00 -0.203999
如何获得属于DataFrame timeindex的最后N分钟/小时的行?
因此,例如,如果我想有最后一小时(从最后一行开始计数),我将从上面的示例中获得最后两行。
假设您的数据框按索引排序,则可以使用从最终索引条目中减去任意时间pd.Timedelta
。
然后,根据过滤数据框df.index
。
lower_range = df.index[-1] - pd.Timedelta(hours=1)
df = df.loc[df.index > lower_range]
print(df)
# 0
# 2011-04-01 04:10:00 -0.116102
# 2011-04-01 04:59:00 0.364772
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句