gpt4 book ai didi

apache-pig - 如何使用 PIG 查找给定数据集中的最大年份?

转载 作者:行者123 更新时间:2023-12-04 02:21:41 27 4
gpt4 key购买 nike

假设我有以下数据集:-

Year Temp

1974 48
1974 48
1991 56
1983 89
1993 91
1938 41
1938 56
1941 93
1983 87

我希望我的最终答案是 93(与 1941 年有关)。我能够找到每年的最高温度(比如 1941-93),但无法仅找到最大值。任何建议表示赞赏。

谢谢,

最佳答案

您可以通过两种方式解决这个问题。

选项 1:使用(Group ALL + MAX)

A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = GROUP A ALL;
C = FOREACH B GENERATE MAX(A.Temp);
DUMP C;

输出:

(93)

选项 2:使用(ORDER 和 LIMIT)

A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = ORDER A BY Temp DESC;
C = LIMIT B 1;
D = FOREACH C GENERATE Temp;
DUMP D;

输出:

(93)

关于apache-pig - 如何使用 PIG 查找给定数据集中的最大年份?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28354361/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com