熊猫比较两个数据框并查找重复的元素

蒂亚戈:

我想比较df和df_equal。df包含几个单独的数据帧

    import pandas as pd

    df1 = pd.DataFrame([[ 'b', 'b', 'b' ]],
        columns=['a', 'b', 'c'])

Output:
    a   b   c
0   b   b   b
    df2 = pd.DataFrame([[ 'x', 'x', 'x' ]],
        columns=['a', 'b', 'c'])
Output:
    a   b   c
0   x   x   x
df = pd.concat([df1, df2])
    a   b   c
0   b   b   b
0   x   x   x
df_equal = pd.DataFrame([[ 'x', 'x', 'x' ]],
    columns=['a', 'b', 'c'])

如何检查df是否重复?

我尝试了.equals:

for row in df:
    df.equals(exactly_equal)

我想要的输出:

False #first row in df 
True  #second row in df
Arne:

你可以只遍历行,例如每一行比较dfdf2(因为df2只有一行):

for row in range(len(df)):
    print((df.iloc[row, ].values == df2.values).all())
False
True

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章