gpt4 book ai didi

hadoop - Pig Latin 中的 FOREACH 多个数据

转载 作者:可可西里 更新时间:2023-11-01 16:34:16 26 4
gpt4 key购买 nike

我可以用 Pig Latin 做这样的事情吗?

data1 = LOAD 'hadoop/text1.txt' AS (line:chararray);
data2 = LOAD 'hadoop/text2.txt' AS (line:chararray);

mixed = FOREACH data1, data2 GENERATE data1:line, data2:line;

最佳答案

一般来说,按照您的要求做是没有意义的,因为数据将由多个映射器加载,可能一次加载一行。不能保证相同的映射器会看到相应的行,也不能保证映射器知道他们正在读取哪个 block 的哪一行。正如 WinnieNicklaus 提到的,最好的办法是标记线条并进行连接。

关于hadoop - Pig Latin 中的 FOREACH 多个数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13397182/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com