假设我有以下DF:
Date ID
2019-06-01 A
2019-06-01 B
2019-06-01 B
2019-06-02 A
2019-06-02 C
2019-06-03 C
2019-06-03 A
什么是获取每个日期的唯一ID的累计计数的最有效的方法:
Date ID
2019-06-01 2
2019-06-02 3
2019-06-03 3
我可以按日期和使用for循环,np.isin
但这在性能方面很糟糕。
谢谢
让我们做
s = df.groupby('Date')['ID'].agg(list).cumsum()
s = s.map(lambda x : len(set(x))).reset_index()
s
Date ID
0 2019-06-01 2
1 2019-06-02 3
2 2019-06-03 3
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句