我有一个大的数据框(1.5mln,13),我想检索所有分组事件的第一次出现的索引。
这些事件以不同的长度重复出现,就像在我的示例日期中一样。
如何获得包含所有第一个“ a”事件和所有第一个“ b”事件的列表?
示例数据:
data = {'event': ['a','a','a','a','a','b','b','b','b','a','a','a','b','b','b','b','b','a','a','a','b','b','b','b']}
df = pd.DataFrame (data, columns = ['event'])
据我了解,您希望事件列中具有相同值的连续行序列中的第一行。
获得此结果的代码是:
df[df.event != df.event.shift()]
(将当前值与前一个值进行比较,查找“不同”的情况,然后在布尔索引中使用此中间结果)。
对于您的数据样本,结果是:
event
0 a
5 b
9 a
12 b
17 a
20 b
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句