gpt4 book ai didi

apache-spark - 如何在 Spark 中实现 "Cross Join"?

转载 作者:行者123 更新时间:2023-12-04 00:27:20 26 4
gpt4 key购买 nike

我们计划将 Apache Pig 代码移至新的 Spark 平台。

Pig 具有“Bag/Tuple/Field”概念,其行为类似于关系数据库。 Pig 提供对 CROSS/INNER/OUTER 连接的支持。

对于 CROSS JOIN,我们可以使用 alias = CROSS alias, alias [, alias …] [PARTITION BY partitioner] [PARALLEL n];

但是当我们转向 Spark 平台时,我在 Spark API 中找不到任何对应物。你有什么主意吗?

最佳答案

oneRDD.cartesian(anotherRDD) .

关于apache-spark - 如何在 Spark 中实现 "Cross Join"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24858489/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com