如何获得分组值和重复值的所有“第一个”实例?

martsc1

我有一个大的数据框(1.5mln,13),我想检索所有分组事件的第一次出现的索引。

这些事件以不同的长度重复出现,就像在我的示例日期中一样。

如何获得包含所有第一个“ a”事件和所有第一个“ b”事件的列表?

示例数据:

data = {'event':  ['a','a','a','a','a','b','b','b','b','a','a','a','b','b','b','b','b','a','a','a','b','b','b','b']}
df = pd.DataFrame (data, columns = ['event'])
Valdi_Bo

据我了解,您希望事件列中具有相同值的连续行序列中的第一行

获得此结果的代码是:

df[df.event != df.event.shift()]

(将当前值与前一个值进行比较,查找“不同”的情况,然后在布尔索引中使用此中间结果)。

对于您的数据样本,结果是:

   event
0      a
5      b
9      a
12     b
17     a
20     b

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用pandas减去数据集中所有列的分组数据中的第一个和最后一个值

如何从一个int的第一个实例的行值中剥离所有内容?

将列的所有值替换为第一个值-按ID分组

Observable.zip但获得第一个值,不要等待所有值

在大于 x 的值的第一个实例之后替换所有后续列值

在两列中显示具有重复值的记录的第一个实例

熊猫分组依据,并找到所有列的第一个非空值

在MS SQL Server中重复该组时,按组删除除第一个和最后一个值以外的所有值(连续)

Python:计算具有重复值的列中每个唯一值的第一个实例

如何从第一个非 nan 值开始分组和计数?

如何使用Lead()和Lag()获得第一个非null值

比较两个数组后,仅删除第一个重复值和所有其他匹配值

谷歌表数组公式求和重复数组中的所有值的第一个值

识别Pandas DataFrame每行中的第一个和所有非零值

Excel函数按行查找和计算所有重复项,不包括第一个实例

按组的第一个值分组值

分组系列的第一个和最后一个值

仅从两个 ArrayList 中删除重复值的第一个实例

如何从其他列中提取列中的所有第一个值

如何从其他列中提取列中的所有第一个值?

如何根据日期用 NaN 替换列的所有非第一个值?

MySQL在分组后获得第一个非空值

使用spark数据框分组时获得条件的列的第一个值

更改列中的所有第一个值,并与其他列分组

对于第一个重复值的实例,返回“一个”,对于其他实例,返回“零”

熊猫:返回值的第一个实例和最后一个实例的索引值

查找特定值的第一个实例并添加ID,重复

将连接查询中的重复值限制为仅显示第一个实例

识别组中重复值的第一个实例