Scala spark:有效检查条件是否在任何地方都匹配?

爱德华·彼得斯

我想要的大致相当于

df.where(<condition>).count() != 0

但是,我敢肯定,一旦发现任何此类违规行为,它就不够聪明,无法停止。我希望某种聚合器能够做到这一点,但是我还没有找到?我可以通过max和某种转换来做到这一点,但是我也不认为它一定会退出(不是专门针对bool,我不确定是否知道没有值大于true)。

更具体地说,我想检查一列是否仅包含单个元素。现在,我最好的主意是抓住第一个价值并进行比较。

拉斐尔·罗斯(Raphael Roth)

我会尝试此选项,它应该快得多:

df.where(<condition>).head(1).isEmpty

您还可以尝试与scala exists(在的第一次出现时停止)一起定义条件true

df.mapPartitions(rows => if(rows.exists(row => <condition>)) Iterator(1) else Iterator.empty).isEmpty

最后,您应该对替代方案进行基准测试

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

是否可以保证多级“结构继承”在任何地方都有效?

从任何地方发布有效的DateTime

在任何地方单击时都隐藏元素,而无需检查每个DOM单击

css 错误是否记录在任何地方?

是否在任何地方都有Plots.jl函数的完整列表?

是否在任何地方都有关于Twisted Straights的权威指南?

是否可以在任何地方都剪切h.264流,而无需重新编码?

在任何地方都显示带有简短代码的WooCommerce优惠券输入字段

我在任何地方都找不到如何从项目菜单更改为所有活动的背景颜色的方法

bash双括号条件表达式是否没有运算符,是否在任何地方指定/记录了?

Alpha 任何地方:如何检查 cookie 是否存在?

是否有任何名为“sdds”的命名空间?因为我无法在任何地方找到它

GitHub Actions-在任何地方都列出了它们吗?

干净的Windows 10安装,Ctrl + Backspace在任何地方都无法使用

输入值在任何地方都包含特定字符

安装Android模拟器后,我在任何地方都找不到它

LaCie外置驱动器突然在任何地方都无法识别

Apt-get安装失败,在任何地方都找不到此错误消息

Debian 10:在任何地方都找不到rfkill,仍然阻止了我的wifi

在任何地方都找不到 curl ibm bluemix .wav 文件

我在任何地方都找不到端口名称

在Scala中,检查数组是否单调的有效方法是什么?

检查可遍历在Scala中是否包含1个以上元素的有效方法

初始化git后,“ ember new”命令失败。是否有详细的日志可以在任何地方查看?

scala distinct() 与 spark distinct(),哪个更有效?

为什么运算符减号(连字符)和加号在代码的几乎任何地方都有效?

函数在 Form Load 中不起作用,但在其他任何地方都有效

從 List 中的任何地方刪除某個值的元素的最有效方法?C#

JPA2:不区分大小写,就像在任何地方匹配