删除一行熊猫数据框中的重复值

健康

我有一个熊猫数据框:

>>df_freq = pd.DataFrame([["Z11", "Z11", "X11"], ["Y11","",""], ["Z11","Z11",""]], columns=list('ABC'))

>>df_freq
    A   B   C
0   Z11 Z11 X11
1   Y11     
2   Z11 Z11 

我想确保每一行只有唯一的值。因此,它应如下所示:删除的值可以替换为零或为空

    A   B   C
0   Z11 0   X11
1   Y11     
2   Z11 0   

我的数据框很大,有数百列和数千行。目的是计算该数据帧中的唯一值。我通过使用将数据帧转换为矩阵并应用

>>np.unique(mat.astype(str), return_counts=True)

但是在某些行中会出现相同的值,因此我想在应用np.unique()方法之前将其删除。我想在每一行中保留唯一值。

海盗

使用的组合astype(bool)duplicated

mask = df_freq.apply(pd.Series.duplicated, 1) & df_freq.astype(bool)

df_freq.mask(mask, 0)

     A  B    C
0  Z11  0  X11
1  Y11        
2  Z11  0     

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从熊猫数据框中的列中的每一行中删除重复值

如何删除熊猫数据框中的唯一行

如何从熊猫数据框中删除一行?

如何删除熊猫数据框中的每一行?

保留熊猫数据框的重复列的第一行和最后一行的值

熊猫数据框中每一行的随机值

数据框中一行中的重复值

从数据框python中删除一行中的重复数据,而不影响DataFrame的形状

删除熊猫数据框中每一行的最后一个词

从R中的数据框中删除一行中重复的元素

比较行并替换熊猫数据框中其中一行中的值

删除熊猫同一行中的重复单词

熊猫用同一行中的其他列值替换数据框值

如何删除熊猫数据框中具有重复列值的行?

如何从熊猫数据框中的分区数据访问上一行的值

如何删除熊猫数据框中的重复值

删除另一行中重复或重复的值

如何在熊猫数据框中删除唯一行?

删除熊猫数据框中每一行的标点符号

根据熊猫数据框中的条件删除每个组的最后一行

使用df.iterrows()删除熊猫数据框中的一行

熊猫数据框groupby并填充第一行值

如何在从R数据框中删除重复项时保留上一行

如何删除熊猫数据框中具有重复的行?

根据条件删除熊猫数据框中的重复行

从熊猫时间序列数据框中删除重复的行

如果值在列表中,则熊猫数据框中的行重复

将列值分配给熊猫数据框中的唯一行

如何将熊猫数据框中的每一行乘以不同的值