尝试以有效的方式按日期范围分隔数据框,到目前为止,我只想出了:
mask0 = df['Date of survey'].between('2010-01-01', '2010-12-31')
mask1 = df['Date of survey'].between('2011-01-01', '2011-12-31')
mask2 = df['Date of survey'].between('2012-01-01', '2012-12-31')
...
maskn = df['Date of survey'].between('nnnn-01-01', 'nnnn-12-31')
任何想法将不胜感激!(我将使用掩码对数据框进行子集化,并获取每年每一列变量的平均和)。
更好的方法是DataFrame.resample
按年份使用汇总功能,例如mean
和sum
:
df1 = df.resample('A', on='Date of survey').agg(['mean','sum'])
或DataFrame.groupby
按年使用Series.dt.year
:
df2 = df.groupby(df['Date of survey'].dt.year).agg(['mean','sum'])
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句