我有一个生成此表的数据框。
Row Number Rank
0 702 20
1 702 20
2 702 6
3 100 5
4 100 5
5 100 1
我希望能够过滤此数据框,以便它仅保留每个行号在“排名”(包括关系)中具有最高值的行。像这个例子:
Row Number Rank
0 702 20
1 702 20
2 100 5
3 100 5
我该如何执行此操作?
计算每次Row Number
使用的最大值groupby.transform('max')
,然后过滤:
df[df.Rank == df.Rank.groupby(df['Row Number']).transform('max')]
Row Number Rank
0 702 20
1 702 20
3 100 5
4 100 5
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句