Apache Spark的不确定性来源

Sava 发表于 Dev

39

萨瓦

我试图找出Spark中所有不确定因素。我知道不确定性可能来自用户提供的功能，例如在map（f）中，f涉及随机。相反，我正在寻找可以导致不确定性的操作，这些操作可以在较低级别的转换/动作（例如混洗）上进行。

零323

从我的头顶上：

需要改组（或通常为网络流量）的操作可能会以不确定的顺序输出值。它包括明显的情况，例如groupBy*或join。一个不太明显的例子是排序后的联系顺序
取决于变化的数据源或可变的全局状态的操作
在转换内部执行的副作用，包括accumulator更新

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-10-31

我来说两句

0 条评论

登录后参与评论

上一篇：内置容器的迭代器

相关文章

不确定性

从polyfit查找不确定性

不确定性与熵的传播

Verilog LRM不确定性

符号链接的不确定性

Scala期货：不确定性输出

开发数据库模型的不确定性

pyhf：执行统计不确定性

修改const值的“不确定性”机制

浮动数据类型不确定性

如何使用Keras计算预测不确定性？

SSH密钥交换配置不确定性

与标称值相对应的可变不确定性

高斯拟合并考虑不确定性

图例在ggplot中添加不确定性

Python中的不确定性包：使用给定的协方差矩阵获取数据不确定性

scipy linalg确定性/不确定性代码

在cockroachdb中，为什么不确定性重新启动不会更新不确定性窗口的上限？

对于SimaPro项目中具有不确定性参数的活动，蒙特卡洛LCA返回常数（无不确定性）

MPI_Bcast会导致数据不确定性问题吗？

一阶逻辑在实践中如何处理不确定性？

从收藏的Python deque的不确定性与秩序; 重复执行产生不同的结果

不确定性的方法有序的流处理单元的状态地图操作？

通过迭代指针键映射上的错误来捕获不确定性

强枚举typedef：clang错误或c ++ 11标准不确定性？

将不确定性纳入pymc3模型

使用不确定性软件包时如何修复ZeroDivisionError？

为什么不确定性，当我注入了多个构造函数的参数？

解析器DCG具有不确定性是否合适？

TOP 榜单

文章

热门标签

归档