样本数据(请注意,您发布的图片未经重新输入就无法被潜在的答疑人使用,因此我在此代替了一个简单的示例):
df=pd.DataFrame({ 'id':[1,1,1,1,2,2,2,2],
'a':range(8), 'b':range(8,0,-1) })
这里的关键是在运用idxmax
和idxmin
,然后用索引把玩,让你可以在一个可读的方式合并的事情。这是完整的答案,您不妨检查一下中间数据框以了解其工作原理。
df_max = df.groupby('id').idxmax()
df_max['type'] = 'max'
df_min = df.groupby('id').idxmin()
df_min['type'] = 'min'
df2 = df_max.append(df_min).set_index('type',append=True).stack().rename('index')
df3 = pd.concat([ df2.reset_index().drop('id',axis=1).set_index('index'),
df.loc[df2.values] ], axis=1 )
df3.set_index(['id','level_2','type']).sort_index()
a b
id level_2 type
1 a max 3 5
min 0 8
b max 0 8
min 3 5
2 a max 7 1
min 4 4
b max 4 4
min 7 1
请特别注意df2如下所示:
id type
1 max a 3
b 0
2 max a 7
b 4
1 min a 0
b 3
2 min a 4
b 7
最后一栏有持有该指数值df
是推导与idxmax
&idxmin
。因此,基本上所有你需要的信息是df2
。它剩下的只是合并背部的问题df
,使之更具可读性。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句