我有一个看起来像这样的数据框:
Reference | ID | Length
ref101 |123456 | 10
ref101 |123789 | 5
ref202 |654321 | 20
ref202 |653212 | 40
我试图确定列中每一行的哪一行Reference
具有最大长度(基于Length
列中的值)。例如,ref101
用ID
123456
大于在长度ref101
与ID 123789。
我一直在玩.groupby()
,但是一无所获。有没有办法在Pandas中执行这种操作?
如果这是您想要的整行,请使用groupby
+ idxmax
:
df.loc[df.groupby('Reference').Length.idxmax()]
Reference ID Length
0 ref101 123456 10
3 ref202 653212 40
如果只需要长度,那么groupby
+max
就足够了:
df.groupby('Reference').Length.max()
Reference
ref101 10
ref202 40
Name: Length, dtype: int64
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句