如何合并熊猫数据框并过滤不同列中的重复内容?

休斯尼·罗菲克

我目前正在python 2.7中学习熊猫。我正在学习熊猫的merge()方法。

这是我创建数据框的代码:

import pandas as pd

eibi = {'A': ['aaa','bbb','ccc','eee','fff'],
        'B': ['bbb','aaa','ccc','fff','eee']
        }

df = pd.DataFrame(eibi)

print df

输出是:

     A    B  
0  aaa  bbb
1  bbb  aaa
2  ccc  ddd
3  eee  fff
4  fff  eee

我想按数据框本身中的行合并数据框。目标是如果B列中的单元格与A列中的单元格匹配,则将该单元格移至C列和D列。

我希望下面的数据框可以使我的预期数据框更清楚。

     A    B    C    D
0  aaa  bbb  bbb  aaa
2  ccc  ddd  
3  eee  fff  fff  eee

我试图复制df数据框,然后使用merge()方法并使用左合并将其合并。这是我的代码:

fd = df

new_dataframe = pd.merge(left=df, right=fd, left_on='A', right_on='B', how='left')

print new_dataframe

输出为:

   A_x  B_x  A_y  B_y
0  aaa  bbb  bbb  aaa
1  bbb  aaa  aaa  bbb
2  ccc  ddd  
3  eee  fff  fff  eee
4  fff  eee  eee  fff

我的问题是“如何删除索引1和4?” 和“是否有其他方法可以获得预期的结果?”

BEN_YO

由于您的问题是如何删除索引1和4

output[~pd.DataFrame(np.sort(output.values)).duplicated()]
Out[816]: 
   A_x  B_x  A_y  B_y
0  aaa  bbb  bbb  aaa
2  ccc  ddd          
3  eee  fff  fff  eee

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何合并过滤后的熊猫数据?

如何删除重复项并过滤XSL中的特定内容?

熊猫:如何合并不同的数据框?

如何合并熊猫数据框中名称相似的列?

熊猫:如何为数据框中至少出现n次的重复项过滤数据框

熊猫数据框-如何消除列中的重复单词

如何合并不同数据框的两列,如果找到匹配项,则使用熊猫在新列中写入“ True”

如何反转熊猫中特定数据框列的内容?

合并熊猫数据框中的列

合并具有不同数据类型的列以在熊猫数据框中创建单个dateTime列

如何合并数据框中的行与不同的列?

从熊猫数据框中删除重复的列?

从熊猫数据框中过滤出多余的重复数据

如何合并熊猫数据框中的行

合并熊猫数据框时出现重复的列

合并两列同时消除熊猫数据框中的重复字符串

如何过滤熊猫数据框中的数字?

通过从包含列表熊猫的列中删除重复项来过滤数据框

自我合并后在熊猫数据框中重复

如何比较两个数据框并过滤发现差异的行和列

比较不同熊猫数据框中的列

如何过滤数据框并根据熊猫数据框中的另一列获取记录总数?

如何在熊猫数据框中按索引过滤重复的行?

在熊猫中合并具有不同列的2个数据框

如何合并具有重复值和其他不同值的数据框列值?

通过对熊猫的不同列应用条件来过滤数据框

如何合并具有不同列名的熊猫数据框

希望在熊猫数据框中合并/连接/分组不同的行

如何在熊猫中合并具有不同值的数据框行