Apache Flink中aJoinFunction
和a有什么区别CoGroupFunction
?语义和执行方式有何不同?
Join和CoGroup转换都将关键字段上的两个输入联接在一起。不同之处在于用户函数的调用方式:
JoinFunction
具有一对匹配记录的键,这些记录具有相同的键字段值。此行为与相等内部联接非常相似。CoGroupFunction
with迭代器。如果输入没有某个键值的记录,则传递一个空的迭代器。CoGroup转换尤其可以用于内部和外部相等联接。因此,它比Join转换更通用。查看Join和CoGroup的执行策略,可以使用基于排序和哈希的联接策略执行Join,而因为CoGroup始终使用基于排序的策略执行。因此,连接通常比联合组更有效,如果可能的话,应该首选联接。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句