例如,假设这是我拥有的数据框:
row object_id
1 1024
2 1024
3 1024
4 1032
5 1032
6 1048
... ...
我想创建一个列occurence_num
,如下所示:
row object_id occurence_num
1 1024 1 # starts count
2 1024 2
3 1024 3
4 1032 1 # restarts count since object_id has changed
5 1032 2
6 1048 1 # restarts count since object_id has changed
... ... ...
在 SQL 中执行此操作的方法也会有所帮助,但我希望能够使用 Pandas 执行此操作。
注意:我在这里找到了一种在 excel 中执行此操作的方法。
您可以使用 cum.count():
df['occurence_num']=df.groupby('object_id').cumcount()+1
>>>print(df)
row object_id occurence_num
1 1024 1
2 1024 2
3 1024 3
4 1032 1
5 1032 2
6 1048 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句