按年份分组和其他列，并根据特定条件的熊猫计算平均值

Danish 发表于 Dev

丹麦文

我有一个数据框，如下所示

Tenancy_ID      Unit_ID             End_Date       Rental_value
1               A                   2012-04-26     10
2               A                   2012-08-27     20
3               A                   2013-04-27     50
4               A                   2014-04-27     40
1               B                   2011-06-26     10
2               B                   2011-09-27     30
3               B                   2013-04-27     60
4               B                   2015-04-27     80

从上面我想准备下面的数据框

预期产量：

Unit_ID   Avg_2011   Avg_2012  Avg_2013  Avg_2014   Avg_2015
A         NaN            15        50        40         NaN
B         20             NaN       60        NaN        80

脚步：

Unit_ID = A，2012年有两份合同，租金分别为10和20，因此平均为15。
Avg_2012 = 2012年的平均租金价值。

耶斯列尔

您可以汇总平均值并按进行重塑Series.unstack，最后更改列的名称按DataFrame.add_prefix以及最后的数据清除-DataFrame.reset_index使用DataFrame.rename_axis：

df1 = (df.groupby(['Unit_ID', df['End_Date'].dt.year])['Rental_value']
         .mean()
         .unstack()
         .add_prefix('Avg_')
         .reset_index()
         .rename_axis(None, axis=1))
print (df1)
  Unit_ID  Avg_2011  Avg_2012  Avg_2013  Avg_2014  Avg_2015
0       A       NaN      15.0      50.0      40.0       NaN
1       B      20.0       NaN      60.0       NaN      80.0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。