熊猫：合并数据框而不创建新列

RedM 发表于 Dev

RedM

我有2个具有相同列的数据框：

df1 = pd.DataFrame([['Abe','1','True'],['Ben','2','True'],['Charlie','3','True']], columns=['Name','Number','Other'])
df2 = pd.DataFrame([['Derek','4','False'],['Ben','5','False'],['Erik','6','False']], columns=['Name','Number','Other'])

给出：

     Name Number Other
0      Abe      1  True
1      Ben      2  True
2  Charlie      3  True

和

    Name Number  Other
0  Derek      4  False
1    Ben      5  False
2   Erik      6  False

我想要一个基于“名称”的输出数据框，这是两者的交集：

output_df = 
        Name Number  Other
    0    Ben      2  True
    1    Ben      5  False

我尝试了基本的熊猫合并，但返回的结果不理想：

pd.merge(df1,df2,how='inner',on='Name') = 
 Name Number_x Other_x Number_y Other_y
0  Ben        2    True        5   False

这些数据帧非常大，所以我更喜欢使用熊猫魔术来使事情保持快速。

耶斯列尔

您可以使用concat，然后通过过滤isin与numpy.intersect1d使用boolean indexing：

val = np.intersect1d(df1.Name, df2.Name)
print (val)
['Ben']

df = pd.concat([df1,df2], ignore_index=True)
print (df[df.Name.isin(val)])
  Name Number  Other
1  Ben      2   True
4  Ben      5  False

另一种可能的解决方案val是intersection集合：

val = set(df1.Name).intersection(set(df2.Name))
print (val)
{'Ben'}

然后可以将索引重置为单调：

df = pd.concat([df1,df2])
print (df[df.Name.isin(val)].reset_index(drop=True))
  Name Number  Other
0  Ben      2   True
1  Ben      5  False

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-4

我来说两句

0 条评论

登录后参与评论

上一篇：使用ngFor索引递增[ngStyle] attr？

熊猫：合并数据框而不创建新列

熊猫：合并数据框而不创建新列

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

SQL Server中的非确定性数据类型

Swift 2.1-对单个单元格使用UITableView

如何避免每次重新编译所有文件？

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

应用发明者仅从列表中选择一个随机项一次

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

HttpClient中的角度变化检测

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何了解DFT结果

Camunda-根据分配的组过滤任务列表

错误：找不到存根。请确保已调用spring-cloud-contract：convert

为什么此后台线程中未处理的异常不会终止我的进程？

构建类似于Jarvis的本地语言应用程序

使用分隔符将成对相邻的数组元素相互连接

您如何通过 Nativescript 中的 Fetch 发出发布请求？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

使用React / Javascript在Wordpress API中通过ID获取选择的多个帖子/页面

使用 text() 獲取特定文本節點的 XPath