gpt4 book ai didi

hadoop - 标量只能与 PIG 中的投影一起使用

转载 作者:可可西里 更新时间:2023-11-01 16:27:22 26 4
gpt4 key购买 nike

标量只能与投影一起使用我在使用 foreach 时遇到此错误。我该如何解决此错误?我如何在 foreach 中使用 LIMIT ?请建议一些提前致谢..

编辑(Tichdroma):从评论中复制代码

A = LOAD 'part-r-00000';
G = Group A by ($0,$2 );
Y = foreach G generate FLATTEN(group), FLATTEN($1);
sorted = order Y by $0 ASC, $1 DESC;
X = foreach Y {
lim = LIMIT sorted 3;
generate lim;
};
Dump x;

最佳答案

LIMIT在 FOREACH 中的 Pig 0.9 中可用 nested_op .

如果你想要每个组的前 N ​​个元素,你可能想尝试迭代每个元素并单独排序和限制它们:

A = LOAD 'part-r-00000';
G = GROUP A by ($0, $2);
X = FOREACH G {
sorted = ORDER A by $0 ASC, $1 DESC;
lim = LIMIT sorted 3;
GENERATE lim;
};
DUMP X;

注意 TOP当您只有一列可比较的值时(在这种情况下不是),可能会很有效。

关于hadoop - 标量只能与 PIG 中的投影一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9108206/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com