检查 Pandas DataFrameGroupBy 对象中列子集的重复行

地狱

假设我有一个 groupby 对象（在 Col1 上分组），如下所示：

Col1     Col2     Col3     Col4     Col5
----------------------------------------
AAA       001      456      846      239     row1
          002      374      238      904     row2
          003      456      846      239     row3

BBB       001      923      222      398     row1
          002      923      222      398     row2
          003      755      656      949     row3

CCC       001      324      454      565     row1
          002      744      345      336     row2
          003      567      355      756     row3

有没有办法根据每个组内的 [Col3, Col4, Col5] 检查重复行。在上面的示例中，对于组 AAA，第 1 行和第 3 行匹配，因为 Col3、Col4、Col5 值相同。再次在 BBB 组中，第 1 行和第 2 行匹配。在 CCC 组中，使用上述逻辑，我们没有任何重复的行。

我们可以创建一个包含“n”个布尔元素的列表（其中“n”代表组的数量），如果该组有任何重复项，则用 True 填充它，否则为 False。因此，对于上面的示例输出将是：

[True, True, False]

呸呸呸呸

您可以尝试groupby列Col1，然后用于duplicated()检查是否有任何重复的 from Col3toCol5

out = (df.groupby('Col1')
       .apply(lambda g: g[['Col3','Col4','Col5']].duplicated().any())
       .tolist())

print(out)

[True, True, False]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-06-1

我来说两句

0 条评论

登录后参与评论

Python Pandas <...上的pandas.core.groupby.DataFrameGroupBy对象>

为什么循环通过 pandas DataFrameGroupBy 对象中途停止

从 pandas.core.groupby.generic.DataFrameGroupBy 对象获取值

从基于列子集的列表中删除重复的 Pandas 数据帧

旋转DataFrameGroupBy panadas对象

熊猫：回填DataFrameGroupBy对象

DataFrameGroupBy中的操作

Pandas中基于行的动态列子集均值

删除 Pandas 中列子集为空的行

遍历pandas DataFrameGroupBy对象以创建具有每月子图的年度图像

在DataFrameGroupby对象上滚动操作

在DataFrameGroupBy对象的组内切片

将DataFrameGroupBy对象转换为DataFrame熊猫

DataFrameGroupBy对象的计算模式时出错

如何计算DataFrameGroupBy对象的中位数？

Python - Groupby 一个 DataFrameGroupBy 对象

在Pandas数据框中的列子集中查找具有非零值的行

按大小对 DataFrameGroupBy 中的组进行排序

pandas - 选择列子集的布尔过滤为真的行

将DataFrameGroupBy对象中的每个分组列转换为列表

检查Pandas数据框列中的重复值

如何通过检查条件在Pandas DataFrame中删除重复项？

Python Pandas：检查一列中的值是否存在于另一列中的行子集中

检查Pandas DataFrame列中的序列

在Pandas的许多列中检查NaN

检查pandas中列的数据类型

如何检查条目是否在 Pandas DataFrame 中？

如何检查python pandas中列的dtype

如何检查pandas df中的单个值

TOP 榜单

文章

检查 Pandas DataFrameGroupBy 对象中列子集的重复行

检查 Pandas DataFrameGroupBy 对象中列子集的重复行

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成