我有一个巨大的制表符分隔文件,如下所示:
3 Line1 0 100 A
4 Line1 100 200 A
7 Line1 200 300 B
2 Line1 300 400 B
12 Line1 400 500 C
10 Line1 500 600 C
对于所有具有字母(A,B等)的行,我需要根据第一列中的数字组合其值。例如,结果应该如下:
7 A
9 B
22 C
我目前正在使用Pandas + Python来解决这个问题。
假设df如下:
val id line col1 col2
0 3 Line1 0 100 A
1 4 Line1 100 200 A
2 7 Line1 200 300 B
3 2 Line1 300 400 B
4 12 Line1 400 500 C
5 10 Line1 500 600 C
然后,我认为您可以使用groupby
后跟sum
:
result_df = df.groupby('col2')['val'].sum().to_frame('Sum')
print(result_df)
结果:
Sum
col2
A 7
B 9
C 22
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句