gpt4 book ai didi

hadoop - 在 Hadoop Pig 的一个元组中查找元素,但在另一个元组中找不到元素

转载 作者:可可西里 更新时间:2023-11-01 16:51:48 24 4
gpt4 key购买 nike

我有两个元组(字符串和大元组——每个都有几百万个字符串),我想在一个元组中查找元素,但不在 Hadoop Pig 中的另一个元组中查找。想知道是否有好的代码引用?

示例输入,

tuple 1: (Hello, World, Hadoop, Pig, Stackoverflow)
tuple 2: (Hello, World, Hadoop, Spark, Python)

示例输出,

(Pig, Stackoverflow)

提前致谢,林

最佳答案

这样做的一种方法是将该元组变成一袋元组,每个字符串都是一个独立的元组。然后就可以在http://datafu.incubator.apache.org/docs/datafu/guide/set-operations.html处使用集差操作了找到一组中的字符串而不是另一组中的字符串。

关于hadoop - 在 Hadoop Pig 的一个元组中查找元素,但在另一个元组中找不到元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32385146/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com