我有一个大型的session熊猫数据框(大约100列):
session_init ID
0 1 675
1 MID 675
2 MID 675
3 MID 675
4 MID 675
5 MID 675
6 1 345
7 MID 345
8 MID 345
9 MID 345
10 MID 345
11 MID 345
12 MID 345
13 1 098
14 MID 098
15 1 675
16 MID 675
17 MID 675
18 MID 675
19 MID 675
20 MID 675
21 MID 675
22 1 098
23 MID 098
24 1 098
25 MID 098
如您在上述熊猫数据框中所看到的,seassion开始标记为1
。是否有任何熊猫函数可以让我计算每个会话的价值计数?例如,在上述数据框中,675
id已启动会话2次。因此,值计数应为:
675 : 2
345 : 1
098 : 3
仅使用value_counts()
以下方法可能会更快:
df.loc[df.session_init == '1', 'ID'].value_counts()
98 3
675 2
345 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句