如何正确使用两个数据框之间的SQL减查询等效项

ychaulagain

我有两个具有1000行的数据框。数据帧相同，但是逐行不相同。可以将以下示例假定为数据帧的截断版本。

df1:

col1 col2 col3

1      2    3
2      3    4
5      6    6
8      9    9

df2:

col1 col2 col3

5      6    6
8      9    9
1      2    3
2      3    4

数据框没有索引，我期望在这些索引上执行sql减查询时返回null。我使用以下查询，但未获得预期的结果。有什么办法可以达到我想要的结果吗？

df3 = df1.merge(df2.drop_duplicates(),how='right', indicator=True)
print(df3)

例如，如果我将df1视为table1并将df2视为table2，并且如果我在SQL Server中运行以下查询，则将返回null（空表）。

SELECT * FROM table1
EXCEPT
SELECT * FROM table2

斯科特·波士顿

是的，您可以像这样使用指标：

df1.merge(df2, how='left', indicator='ind').query('ind=="left_only"')

df1在哪里：

   col1  col2  col3
0   1.0   2.0   3.0
1   2.0   3.0   4.0
2   5.0   6.0   6.0
3   8.0   9.0   9.0
4  10.0  10.0  10.0

df2是：

   col1  col2  col3
0     5     6     6
1     8     9     9
2     1     2     3
3     2     3     4

输出：

   col1  col2  col3        ind
4  10.0  10.0  10.0  left_only

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-02-2

我来说两句

0 条评论

登录后参与评论

上一篇：如何通过SQL查询找到一组结果的平均值？

如何获取两个数据框列之间的相交项？

如何找到两个数据框行之间的差异？

如何找到两个数据框之间的共同行？

Scala 数据框：如何使用两个数据框之间的条件向数据框添加一列？

使用pandas concat合并两个数据框时如何删除重复项

使用两个数据框的日期之间的累计总和

如何使用熊猫求和两个数据框之间的列？

使用熊猫，如何比较两个数据框的2列之间的值并将其推到新的数据框？

在两个数据框之间使用“ VLOOKUP”创建新的数据框

如何合并两个数据框？

R计算两个数据帧之间的重复项

如何使用WHERE子句查询两个日期范围之间的数据？-SQL

熊猫：如何跟踪两个数据框之间匹配数据条目的索引？

合并两个数据框后如何删除重复项？

如何合并两个数据框而不在 Python 中添加重复项？

在两个数据框差异之间应用Pandas样式

熊猫：在两个数据框之间连接信息

突出显示两个数据框之间的差异

两个数据框之间的列差异

比较两个数据框R之间的列

在PySpark中的两个数据框之间查找更改

在两个数据框之间找到相等的列

两个数据框之间的相关性

比较两个数据框之间的日期列

计算两个数据框之间的熊猫集差异

查找两个数据框之间的重叠区域

r比较两个数据框之间的列类型

两个数据框之间的值匹配

熊猫中两个数据框之间的匹配日期

TOP 榜单

文章

如何正确使用两个数据框之间的SQL减查询等效项

如何正确使用两个数据框之间的SQL减查询等效项

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称