我有一个像这样的数据框:
Index Date Type Value
0 01/01/2010 A 10
1 01/01/2010 B 15
2 01/01/2010 B 25
3 01/01/2010 A 12
4 01/02/2010 A 9
5 01/02/2010 B 17
6 01/02/2010 B 20
7 01/02/2010 A 8
我想创建一个新列,以便对每一行平均基于Type和Date的值,因此对于给定的日期,所有具有Type A的行将具有相同的平均值,而对于Type B将具有相同的平均值。 2010年1月1日,所有类型A的丝束将为(10 + 12)/ 2 = 11,所有类型B的行将为(15 + 25)/ 2 = 20:
Index Date Type Value Value2
0 01/01/2010 A 10 11
1 01/01/2010 B 15 20
2 01/01/2010 B 25 20
3 01/01/2010 A 12 11
4 01/02/2010 A 9 8.5
5 01/02/2010 B 17 13.5
6 01/02/2010 B 20 13.5
7 01/02/2010 A 8 8.5
您可能想要groupby
并且transform
(尽管我不确定您期望的输出中为什么键入B
for01/02/2010
是13.5
,我认为应该是18.5
,即17和20的平均值):
df['Value2'] = df.groupby(['Type','Date']).Value.transform('mean')
>>> df
Index Date Type Value Value2
0 0 01/01/2010 A 10 11.0
1 1 01/01/2010 B 15 20.0
2 2 01/01/2010 B 25 20.0
3 3 01/01/2010 A 12 11.0
4 4 01/02/2010 A 9 8.5
5 5 01/02/2010 B 17 18.5
6 6 01/02/2010 B 20 18.5
7 7 01/02/2010 A 8 8.5
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句