如何合并或处理数据框中的重复列?

生锈的沙克尔福德

我有一个 df 看起来像这样:

column1 columnId   column1
aaa        1        
bbb        2       bbb
ccc        3       

无论如何,我可以将所有重复的列与现有数据合并吗?

新的 df 看起来像这样:

column1 columnId  
aaa        1        
bbb        2       
ccc        3       

请注意,这是一个示例,我有 18 个重复列,但经过重复数据删除后,我有 9 个。

先感谢您

贝尼

使用groupbyfirst

df.groupby(level=0,axis=1).first()
Out[915]: 
  column1  columnId
0     aaa         1
1     bbb         2
2     ccc         3

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何“合并”长格式数据框中的重复列值

合并数据框中的重复列

在Spark数据框中合并重复列

替换数据框中的重复列

重塑R中的数据框重复列

如何合并pyspark中的重复列?

如何在不重复列名的情况下将系列连接或合并到数据框

合并 2 个具有重复列的数据框?

对 R 中数据框中的重复列求和

如何删除熊猫数据框中具有重复列值的行?

如何使用 Python 使用重复列值来分隔数据框中的行?

如何保留数据框中重复列名的最后一列?

从具有重复列值的数据框中创建字典

Pyspark删除数据框中的重复列

查找数据框集合中的所有重复列

删除数据框列表中的重复列

python - 当forloop放置在python中的while循环中时,如何避免在pandas数据框中重复列标题

如何处理熊猫数据框中的重复字段?

合并大型数据框中的重复行

在数据框中添加两个重复列并删除重复项

在pandas数据框中基于相应列值重复列,并基于总计值重复行

如何处理复杂的数据框合并

如何从列中拆分数据并从数据框中添加到列表中,同时为单行重复列表元素?(熊猫)

从 json 列嵌套对象中删除 Pyspark 数据框中的重复列名

如何在scala中使用spark数据框找到对称的重复列(2列)?

如何用重复列表将熊猫数据框的行(而不是列)分开?

数据表连接中的重复列

删除数据框中至少有两个重复列的行

熊猫:仅删除熊猫数据框中的特定重复列值